Claude Code za 40 dolara našao način da AI manje troši dok razmišlja
AutoTTS pretvara kodnog agenta u alat za traženje jeftinijih pravila AI rezoniranja.📷 AI-generated image / TECH&SPACE
- ★AutoTTS je koristio Claude Code za samostalno traženje kontrolnih algoritama za AI rezoniranje.
- ★Pronađeni postupak navodno troši oko 70 posto manje računanja od standardne self-consistency metode uz istu točnost.
- ★Cijela potraga trajala je 160 minuta i koštala 40 dolara, što je važan signal za jeftinije automatizirano AI istraživanje.
Istraživači s UMD-a, Googlea, Mete i drugih institucija nisu ručno dizajnirali još jednu politiku za AI rezoniranje. Pustili su kodnog agenta da je traži. Prema izvještaju The Decodera, sustav AutoTTS koristio je Claude Code za samostalno otkrivanje algoritama koji odlučuju koliko računanja model treba potrošiti tijekom zaključivanja.
To je precizniji problem nego što zvuči. Današnji modeli sve češće ne daju samo jedan odgovor. Sustav može zatražiti više pokušaja, usporediti lance rezoniranja, glasati među odgovorima ili zaustaviti proces kada dodatni pokušaji više ne vrijede troška. Taj sloj obično se naziva test-time scaling: performanse se ne izvlače samo iz većeg treniranja, nego i iz pametnijeg korištenja modela u trenutku odgovaranja.
AutoTTS je u tom prostoru pronašao postupak koji, prema dostavljenom kontekstu, zadržava točnost standardne self-consistency metode uz oko 70 posto manje računanja. Self-consistency je poznata tehnika u kojoj model generira više lanaca zaključivanja, a zatim se bira najdosljedniji odgovor; izvorna metoda opisana je u radu Self-Consistency Improves Chain of Thought Reasoning in Language Models. Njezina slabost nije misteriozna: više pokušaja znači više tokena, više latencije i viši infrastrukturni račun.
AutoTTS je kodnog agenta pretvorio u istraživački alat koji traži kada model treba misliti dulje, a kada samo troši računanje.
Ključni pomak je kontrola broja pokušaja, a ne samo veći model.📷 AI-generated image / TECH&SPACE
Zato je najvažniji detalj ove priče možda cijena potrage, a ne samo postotak uštede. Prema izvještaju, cijeli ciklus trajao je 160 minuta i koštao 40 dolara. Ako je taj rezultat ponovljiv na širem skupu zadataka, ovo nije samo optimizacijski trik. To je nacrt za jeftinu petlju u kojoj kodni agent piše, testira i bira algoritme koje ljudski istraživači možda ne bi intuitivno predložili.
Institucionalni kontekst je također bitan, ali ne treba ga pretvarati u dekoraciju. UMD, Google Research i Meta AI ovdje daju težinu radu, no tehnička poruka je šira: kodni agenti mogu pretraživati dizajnerski prostor optimizacijskih politika, ne samo pomagati oko implementacije. Drugim riječima, agent nije samo pomoćnik koji ubrzava poznati postupak. U ovom slučaju sudjeluje u izboru samog postupka.
Treba ostati hladne glave. Iz dostupnog konteksta ne slijedi da je AutoTTS pronašao univerzalni zakon AI rezoniranja, niti da će isti algoritam jednako raditi na svim modelima i zadacima. Ono što znamo dovoljno je konkretno: u prijavljenom eksperimentu pronašao je kontrolni algoritam koji smanjuje računanje u odnosu na standardnu self-consistency metodu uz zadržanu točnost. Ako se takve petlje pokažu stabilnima, važan dio budućih AI sustava mogao bi biti upravo ovaj tihi kontrolni sloj: odluka kada vrijedi platiti za dodatno razmišljanje, a kada je dodatno rezoniranje samo skupa buka.

