Anthropic i 80% posla: teorija nasuprot realnosti
Editorialni vizual za "Anthropic i 80% posla: teorija nasuprot realnosti", usmjeren na glavni sustav i ulog priÄe.đ· Photo by Markus Winkler on Pexels
- â LLM-i bi mogli obaviti 80% zadataka u 22 kategorije posla
- â Studija se oslanja na teorijske, ne dokazane sposobnosti
- â Tko profitira od ovakvih procjena â i zaĆĄto to nije neutralno
Anthropicova studija iz 2023. koja tvrdi kako bi veliki jezikovi modeli (LLM-i) mogli obaviti 80% pojedinaÄnih zadataka u 22 kategorije posla zvuÄi impresivno â dok se ne pogleda ĆĄto se zapravo mjeri. RijeÄ je o teorijskim sposobnostima, a ne stvarnoj implementaciji, ĆĄto znaÄi da su brojevi izvuÄeni iz laboratorijskih uvjeta, a ne iz polja gdje AI susreÄe kaos realnih radnih okruĆŸenja.
IzvjeĆĄtaj GPTs are GPTs, koji je koautorirala i OpenAI, ne analizira postojeÄe alate veÄ anticipirano softversko okruĆŸenje â hipotezu o tome kako bi LLM-i mogli funkcionirati u idealnim uvjetima. To je kljuÄna razlika: dokazano je da modeli mogu simulirati obavljanje zadataka, ali ne i da ih mogu konzistentno, pouzdano i ekonomiÄno izvesti u produkciji.
Dakle, radi se viĆĄe o marketing-adjacentnom istraĆŸivanju nego o nepristranoj analizi. Äak i ako pretpostavimo da su procjene toÄne, ostaje pitanje tko od toga ima korist â i Äije interese studija zapravo sluĆŸi.
Odgovor nije teĆĄko pogoditi: tvrtke koje razvijaju LLM-e dobivaju argument za ubrzano uvoÄenje svojih rjeĆĄenja, dok zaposlenici i regulatorni organi ostaju s pitanjima o realnim posljedicama. Razlika izmeÄu teorijske sposobnosti i stvarne izvedbe je poput razlike izmeÄu automobilskog prototipa koji vozi 300 km/h na testnoj stazi i serijskog modela koji mora izdrĆŸati svakodnevnu voĆŸnju.
A upravo ta razlika Äesto biva zaboravljena u naslovima koji glase kao da je AI veÄ preuzeo kontrolu nad uredskim stolovima.
IzmeÄu akademskog modela i korporacijskog marketinga
Drugi vizualni kut koji prikazuje praktiÄni mehanizam iza teme "IzmeÄu akademskog modela i korporacijskog marketinga".đ· Photo by Tara Winstead on Pexels
Zanimljivo je kako studija klasificira poslove prema izloĆŸenosti LLM-ima, ali ne uzima u obzir troĆĄkove implementacije, potrebnu prilagodbu postojeÄih sustava ili Äak osnovno pitanje: hoÄe li poslodavci uopÄe htjeti automatizirati 80% zadataka ako to znaÄi gubitak ljudske kontrole nad kljuÄnim procesima. IstraĆŸivaÄi s Penn Statea upozoravaju da takve procjene Äesto ignoriraju ljudski faktor â od otpora zaposlenika do pravnih implikacija kada AI pogreĆĄi.
Dok korporacije poput Anthropica i OpenAI koriste ove studije za lobiranje u korist brĆŸeg usvajanja svojih proizvoda, razvojna zajednica reagira s skepsom. Na GitHubu i Hacker Newsu se pojavljuju komentari o tome kako 80% zvoni kao broj izabran zbog marketinĆĄkog uÄinka, a ne kao rezultat rigorozne metodologije.
Jedan od Äesto spomenutih problema je ĆĄto studija ne razlikuje izmeÄu automatizacije (gde AI potpuno preuzima zadatak) i augmentacije (gde Äovjek i dalje ima kljuÄnu ulogu). JoĆĄ zanimljivije je ĆĄto izvjeĆĄtaj ne spominje koji poslovi bi zapravo nestali, a koji bi se samo transformirali.
To su pitanja koja studija ostavlja nerijeĆĄena, dok se mediji bace na senzacionalne naslove o AI koji Äe uzeti vaĆĄ posao. Pravi test za ove procjene bit Äe kada tvrtke pokuĆĄaju skalirati LLM-e u stvarnim uvjetima â a tamo ih Äekaju problemi kao ĆĄto su troĆĄkovi obuke modela za specifiÄne poslove, potreba za ljudskom validacijom i, naravno, otpor sindikata.
KonaÄno, vaĆŸno je razumjeti da LLM-i nisu joĆĄ uvijek spremni za ĆĄiru uporabu u poslovnim okruĆŸenjima. Potrebno je joĆĄ istraĆŸivanja i razvoja kako bi se rijeĆĄili problemi povezani s implementacijom i skaliranjem. Do tada, 80% ostaje samo broj koji zvuÄi impresivno, ali nije temeljeno na stvarnosti.

