Za 5 mesiacov mi cez Claude Code prešlo 13,2 miliardy tokenov. 96 % z nich obslúžila cache. Pri bežných API cenách by to stálo 9 906 $ — ja platím paušál. To 96 % nie je prepínač; je to rok merania toho, čo nástroje reálne posielajú modelu.
Náklad na AI držia tri veci: ktorý model robí prácu (väčšinu utiahne lacný, drahý nech len rozmýšľa), ako dobre harness opätovne používa kontext, a či zakaždým nasadíte najnovší model len preto, že vyšiel. Pred rokom vyzeral Haiku drahý. Dnes je to drobné. Hranica sa posúva dole rýchlejšie, než stúpa faktúra.
Nedá sa predpovedať, čo budú tokeny stáť o rok. Dá sa zmerať, čo vás stoja tento mesiac. Firmy, čo to merajú, zvládnu zdraženie, ktoré ostatní pocítia ako krízu.