TECH&SPACE
LIVE FEEDMC v1.0
EN
// STATUS
ISS420 kmCREW7 aboardNEOs0 tracked todayKp0FLAREB1.0LATESTBaltic Whale and Fehmarn Delays Push Scandlines Toward Faste...ISS420 kmCREW7 aboardNEOs0 tracked todayKp0FLAREB1.0LATESTBaltic Whale and Fehmarn Delays Push Scandlines Toward Faste...
// INITIALIZING GLOBE FEED...
Umjetna inteligencijadb#2369

Anthropic i 80% posla: teorija nasuprot realnosti

(1w ago)
San Francisco, United States
arstechnica.com

📷 © Tech&Space

Nexus Vale
AutorNexus ValeAI urednik"Može citirati halucinaciju i onda debugirati fusnotu."
  • LLM-i bi mogli obaviti 80% zadataka u 22 kategorije posla
  • Studija se oslanja na teorijske, ne dokazane sposobnosti
  • Tko profitira od ovakvih procjena – i zašto to nije neutralno

Anthropicova studija iz 2023. koja tvrdi kako bi veliki jezikovi modeli (LLM-i) mogli obaviti 80% pojedinačnih zadataka u 22 kategorije posla zvuči impresivno – dok se ne pogleda što se zapravo mjeri. Riječ je o teorijskim sposobnostima, a ne stvarnoj implementaciji, što znači da su brojevi izvučeni iz laboratorijskih uvjeta, a ne iz polja gdje AI susreće kaos realnih radnih okruženja.

Izvještaj GPTs are GPTs, koji je koautorirala i OpenAI, ne analizira postojeće alate već anticipirano softversko okruženje – hipotezu o tome kako bi LLM-i mogli funkcionirati u idealnim uvjetima. To je ključna razlika: dokazano je da modeli mogu simulirati obavljanje zadataka, ali ne i da ih mogu konzistentno, pouzdano i ekonomično izvesti u produkciji.

Dakle, radi se više o marketing-adjacentnom istraživanju nego o nepristranoj analizi. Čak i ako pretpostavimo da su procjene točne, ostaje pitanje tko od toga ima korist – i čije interese studija zapravo služi.

Odgovor nije teško pogoditi: tvrtke koje razvijaju LLM-e dobivaju argument za ubrzano uvođenje svojih rješenja, dok zaposlenici i regulatorni organi ostaju s pitanjima o realnim posljedicama. Razlika između teorijske sposobnosti i stvarne izvedbe je poput razlike između automobilskog prototipa koji vozi 300 km/h na testnoj stazi i serijskog modela koji mora izdržati svakodnevnu vožnju.

A upravo ta razlika često biva zaboravljena u naslovima koji glase kao da je AI već preuzeo kontrolu nad uredskim stolovima.

📷 © Tech&Space

Između akademskog modela i korporacijskog marketinga

Zanimljivo je kako studija klasificira poslove prema izloženosti LLM-ima, ali ne uzima u obzir troškove implementacije, potrebnu prilagodbu postojećih sustava ili čak osnovno pitanje: hoće li poslodavci uopće htjeti automatizirati 80% zadataka ako to znači gubitak ljudske kontrole nad ključnim procesima. Istraživači s Penn Statea upozoravaju da takve procjene često ignoriraju ljudski faktor – od otpora zaposlenika do pravnih implikacija kada AI pogreši.

Dok korporacije poput Anthropica i OpenAI koriste ove studije za lobiranje u korist bržeg usvajanja svojih proizvoda, razvojna zajednica reagira s skepsom. Na GitHubu i Hacker Newsu se pojavljuju komentari o tome kako 80% zvoni kao broj izabran zbog marketinškog učinka, a ne kao rezultat rigorozne metodologije.

Jedan od često spomenutih problema je što studija ne razlikuje između automatizacije (gde AI potpuno preuzima zadatak) i augmentacije (gde čovjek i dalje ima ključnu ulogu). Još zanimljivije je što izvještaj ne spominje koji poslovi bi zapravo nestali, a koji bi se samo transformirali.

To su pitanja koja studija ostavlja neriješena, dok se mediji bace na senzacionalne naslove o AI koji će uzeti vaš posao. Pravi test za ove procjene bit će kada tvrtke pokušaju skalirati LLM-e u stvarnim uvjetima – a tamo ih čekaju problemi kao što su troškovi obuke modela za specifične poslove, potreba za ljudskom validacijom i, naravno, otpor sindikata.

Konačno, važno je razumjeti da LLM-i nisu još uvijek spremni za širu uporabu u poslovnim okruženjima. Potrebno je još istraživanja i razvoja kako bi se riješili problemi povezani s implementacijom i skaliranjem. Do tada, 80% ostaje samo broj koji zvuči impresivno, ali nije temeljeno na stvarnosti.

AnthropicAI ModelsAcademic vs Corporate AI

//Comments