Cursor Composer 2 ruši cijenu kodnih modela, ali Kimi baza mijenja priču
The hero scene emphasizes Composer 2 as both a pricing attack and a story about an initially hidden model base.📷 AI-generated / Tech&Space
- ★Cursor navodi 61,3 na CursorBenchu i 73,7 na SWE-bench Multilingual za Composer 2
- ★Standardna cijena je 0,50 dolara za ulazne i 2,50 dolara za izlazne tokene po milijunu
- ★Cursor je naknadno priznao da se Composer 2 oslanja na Moonshot AI-jev Kimi K2.5
Cursorov Composer 2 nije zanimljiv zato što tvrdi da je najbolji model za kodiranje. Zanimljiv je zato što standardna verzija košta 0,50 dolara za milijun ulaznih tokena i 2,50 dolara za milijun izlaznih tokena. Brža varijanta, koju Cursor opisuje kao zadanu, stoji 1,50 i 7,50 dolara po milijunu tokena.
To je izravan pritisak na ekonomiku koju su OpenAI i Anthropic izgradili oko premium kodnih modela. Cursor u vlastitoj objavi navodi 61,3 na CursorBenchu, 61,7 na Terminal-Benchu 2.0 i 73,7 na SWE-bench Multilingualu. Brojke su korisne, ali treba ih čitati kao Cursorove metrike, ne kao neovisnu presudu.
The Decoder je dodao ključni obrat: Composer 2 nije bio jasno predstavljen kao model koji se oslanja na Moonshot AI-jev Kimi K2.5. Cursorov zaposlenik Lee Robinson kasnije je rekao da oko četvrtine pretreniranja dolazi iz baze, dok ostatak čine Cursorovo dodatno treniranje i fine-tuning.
To ne diskvalificira model. Fine-tunanje jake otvorene baze za usku domenu često je pametniji put od pokušaja da se ispočetka izgradi frontier laboratorij. Problem je što tržište drugačije čuje "naš model" kada se tek naknadno dozna da ispod stoji tuđi temelj.
Composer 2 izgleda kao Cursorov odgovor na OpenAI i Anthropic, no najvažnija lekcija nije benchmark nego koliko vrijedi transparentno fine-tunanje tuđeg otvorenog modela.
The second visual shows the distinction between an open base, fine-tuning, and the market product.📷 AI-generated / Tech&Space
Composer 2 cilja dugotrajne kodne zadatke, gdje agent mora obaviti stotine koraka, a ne samo pogoditi jednu funkciju. Cursor zato naglašava reinforcement learning na long-horizon coding taskovima. To je relevantno jer moderni IDE agenti sve manje sliče autocompleteu, a sve više malom operateru koji dira datoteke, terminal i testove.
Ali CursorBench nije isto što i vaš naslijeđeni monorepo. Sintetički i interni benchmarkovi mogu nagraditi zadatke koji su uredni, izolirani i dobro instrumentirani. Stvarni proizvodni kod ima poludokumentirane API-je, neuredne migracije, sigurnosne iznimke i ljudske zahtjeve koji dolaze u zadnjoj rečenici ticket-a.
Najjači argument za Composer 2 zato možda nije sposobnost, nego distribucija. Cursor već sjedi u radnom toku programera, podržava modele trećih strana i može odlučivati kada vlastiti model zadovoljava dovoljno dobro. Ako je jeftiniji model dovoljno dobar za velik dio zadataka, premium modeli postaju specijalni alat, ne zadani izbor.
Zaključak je neugodan za sve strane. Cursor je trebao odmah reći što je Kimi u ovoj priči. Istodobno, ako Composer 2 u praksi bude dovoljno blizu skupljim modelima, pitanje se vraća frontier laboratorijima: koliko njihove cijene plaćaju jedinstvenu sposobnost, a koliko naviku da se vjeruje zatvorenom brendu?

