Anthropic i 80% posla: teorija nasuprot realnosti
📷 © Tech&Space
- ★LLM-i bi mogli obaviti 80% zadataka u 22 kategorije posla
- ★Studija se oslanja na teorijske, ne dokazane sposobnosti
- ★Tko profitira od ovakvih procjena – i zašto to nije neutralno
Anthropicova studija iz 2023. koja tvrdi kako bi veliki jezikovi modeli (LLM-i) mogli obaviti 80% pojedinačnih zadataka u 22 kategorije posla zvuči impresivno – dok se ne pogleda što se zapravo mjeri. Riječ je o teorijskim sposobnostima, a ne stvarnoj implementaciji, što znači da su brojevi izvučeni iz laboratorijskih uvjeta, a ne iz polja gdje AI susreće kaos realnih radnih okruženja.
Izvještaj GPTs are GPTs, koji je koautorirala i OpenAI, ne analizira postojeće alate već anticipirano softversko okruženje – hipotezu o tome kako bi LLM-i mogli funkcionirati u idealnim uvjetima. To je ključna razlika: dokazano je da modeli mogu simulirati obavljanje zadataka, ali ne i da ih mogu konzistentno, pouzdano i ekonomično izvesti u produkciji.
Dakle, radi se više o marketing-adjacentnom istraživanju nego o nepristranoj analizi. Čak i ako pretpostavimo da su procjene točne, ostaje pitanje tko od toga ima korist – i čije interese studija zapravo služi.
Odgovor nije teško pogoditi: tvrtke koje razvijaju LLM-e dobivaju argument za ubrzano uvođenje svojih rješenja, dok zaposlenici i regulatorni organi ostaju s pitanjima o realnim posljedicama. Razlika između teorijske sposobnosti i stvarne izvedbe je poput razlike između automobilskog prototipa koji vozi 300 km/h na testnoj stazi i serijskog modela koji mora izdržati svakodnevnu vožnju.
A upravo ta razlika često biva zaboravljena u naslovima koji glase kao da je AI već preuzeo kontrolu nad uredskim stolovima.
📷 © Tech&Space
Između akademskog modela i korporacijskog marketinga
Zanimljivo je kako studija klasificira poslove prema izloženosti LLM-ima, ali ne uzima u obzir troškove implementacije, potrebnu prilagodbu postojećih sustava ili čak osnovno pitanje: hoće li poslodavci uopće htjeti automatizirati 80% zadataka ako to znači gubitak ljudske kontrole nad ključnim procesima. Istraživači s Penn Statea upozoravaju da takve procjene često ignoriraju ljudski faktor – od otpora zaposlenika do pravnih implikacija kada AI pogreši.
Dok korporacije poput Anthropica i OpenAI koriste ove studije za lobiranje u korist bržeg usvajanja svojih proizvoda, razvojna zajednica reagira s skepsom. Na GitHubu i Hacker Newsu se pojavljuju komentari o tome kako 80% zvoni kao broj izabran zbog marketinškog učinka, a ne kao rezultat rigorozne metodologije.
Jedan od često spomenutih problema je što studija ne razlikuje između automatizacije (gde AI potpuno preuzima zadatak) i augmentacije (gde čovjek i dalje ima ključnu ulogu). Još zanimljivije je što izvještaj ne spominje koji poslovi bi zapravo nestali, a koji bi se samo transformirali.
To su pitanja koja studija ostavlja neriješena, dok se mediji bace na senzacionalne naslove o AI koji će uzeti vaš posao. Pravi test za ove procjene bit će kada tvrtke pokušaju skalirati LLM-e u stvarnim uvjetima – a tamo ih čekaju problemi kao što su troškovi obuke modela za specifične poslove, potreba za ljudskom validacijom i, naravno, otpor sindikata.
Konačno, važno je razumjeti da LLM-i nisu još uvijek spremni za širu uporabu u poslovnim okruženjima. Potrebno je još istraživanja i razvoja kako bi se riješili problemi povezani s implementacijom i skaliranjem. Do tada, 80% ostaje samo broj koji zvuči impresivno, ali nije temeljeno na stvarnosti.