DSN LINK STABLECARRIER WAVE LOCKORBITAL INDEX HOTSIGNAL CLOCK SYNCLOW NOISE FLOORFRAME BUFFER ONLINE
Loading
226 članaka
OpenAI ne mijenja samo model u izborniku, nego način na koji ChatGPT korisniku servira pisanje, kodiranje i prijelaz sa starijih generacija.
OpenAI je objavio video u kojem Lauren Steinberg iz Loblawa tvrdi da Codex i ChatGPT Images 2.0 mijenjaju tempo rada digitalnih timova u velikoj maloprodaji.
NVIDIA kroz Nsight Copilot za VS Code pokazuje da AI pomoć za CUDA razvoj želi izvući iz generičkog chata i spustiti u lokalni, NVIDIA-specifični radni tok.
Ako je jezični model motor AI agenta, novi pregledni rad tvrdi da je softverski harness mjenjač, kočnica i kontrolna ploča bez kojih autonomija ostaje demonstracija.
Studentski AI prototipovi sa Sveučilišta Waterloo zanimljivi su upravo zato što ne pokušavaju glumiti revoluciju, nego rješavati uske, vidljive probleme u učenju i radu.
OpenAI je predstavio Rosalind Biodefense, program koji GPT-Rosalind iz laboratorijske ambicije premješta u osjetljiv javnozdravstveni operativni prostor.
Claude Opus 4.8 zanimljiv je upravo zato što ga Anthropic, prema dostupnom kontekstu, ne pokušava pretvoriti u još jedan spektakl.
Anthropic je iz još jedne AI runde izašao s brojkama koje više ne opisuju startup, nego infrastrukturnu silu na pragu bilijunske valuacije.
OpenAI je u novoj Build Hour epizodi Agents SDK pozicionirao kao praktični sloj za agente koji ne završavaju na jednom promptu, nego rade kroz datoteke, naredbe i memoriju.
Microsoft 365 Copilot ulazi u redizajniranu fazu: manje vizualne gužve, brže učitavanje i odgovori koji bi trebali biti lakši za skeniranje.
Anthropic je zatvorio privatnu rundu koja više nalikuje infrastrukturnom referendumu o generativnoj umjetnoj inteligenciji nego običnom startup financiranju.
AI podatkovni centri više nisu samo pitanje čipova, struje i vode, nego sve otvorenije pitanje policijskog okvira oko javnog protivljenja.
Rekurzivno samopoboljšanje zvuči kao precizniji put prema naprednoj umjetnoj inteligenciji, ali zasad nasljeđuje isti problem kao AGI: svi ga žele, malo tko ga može uredno definirati.
General Computeova oklada na SambaNovu nije samo još jedna investicijska fusnota, nego signal da se tržište AI računalne infrastrukture ponovno otvara izvan najočitijih pobjednika.
NVIDIA je otvorila vrlo konkretan problem moderne AI infrastrukture: replike za inferenciju mogu se skalirati brzo na papiru, ali korisnik i dalje čeka dok se model stvarno podigne.
NVIDIA tvrdi da je Blackwell postavio novi STAC-AI rekord za LLM inferenciju u financijama, što je važan signal za banke, fondove i trading infrastrukturu koja sve više ovisi o jezičnim modelima.
Microsoftov MAI-Image-2.5 više nije eksperiment koji samo popunjava portfelj: prema Arena poretku, sada stoji uz Googleov Nano Banana 2 i dovoljno blizu vrha da ga treba shvatiti ozbiljno.
Ako se vodeći AI botovi spotaknu već na testovima usklađenosti, europska regulacija prestaje biti apstraktna prijetnja i postaje operativni problem.
dlt nije još jedan sjajni AI alat, nego otvoreni Python SDK za dosadniji, ali presudan sloj: pouzdano premještanje podataka u produkciji.
Trajectory napada neugodan problem generativnog AI-ja: proizvodi nakon lansiranja često izgledaju živo u sučelju, ali u učenju iz stvarne upotrebe ostaju spori i kruti.
OpenAI je s Thriveom i Creteom predstavio primjer Codex agenta za porezne prijave, ali najvažniji detalj nije automatizacija nego tvrdnja da se sustav može sustavno poboljšavati iz vlastitog rada.
Nvidijin Vera CPU u prvim Linux benchmarkovima ne ruši EPYC i Xeon preko noći, ali za prvu generaciju vlastitog serverskog procesora rezultat je dovoljno blizu da mijenja ton razgovora.
Duboki istraživački agenti zvuče kao uredna automatizacija znanja, ali produkcija ih brzo pretvara u problem orkestracije, povjerenja i kontrole izvora.
SIGnature cilja jedan od tvrdoglavijih problema single-cell biologije: kako iz velikih RNA foundation modela izvući rang važnosti gena koji se može uspoređivati između skupova podataka.
CVPR 2026 ulazi u godinu s više od 16.000 prijavljenih radova, a ta brojka više govori o pritisku u AI ekosustavu nego o konferencijskoj logistici.
BadHost nije spektakularan kvar modela, nego neugodniji signal: AI agenti sve češće ovise o običnim web paketima koje napadači već znaju čitati kao kartu.
Google DeepMind je objavio video najavu za Gemini for Science, specijalizirani AI model usmjeren na znanstveno istraživanje, što je važan signal za smjer u kojem se pomiče primjena generativne umjetne inteligencije.
Svibanjski AI pregled otvara pitanje tko će nakon Gemini Flasha 3.5 određivati tempo, pristup i kontrolu nad sljedećim slojem AI infrastrukture.
AI sigurnost prestaje biti tehnička fusnota kada model počne utjecati na podatke, odluke, kod i reputaciju tvrtke.
AI industrija više ne traži samo inženjere koji znaju ubrzati model, nego i ljude koji znaju postaviti pitanje zašto bi ga uopće trebalo pustiti u svijet.
Najopasnija slabost AI provjere činjenica nije samo pogrešan odgovor, nego uvjerljiv pogrešan odgovor koji izgleda dovoljno uredno da prođe dalje.
IBM-ov novi GNN video nije istraživački događaj, ali dobro pogađa osnovno pitanje: kako AI uči kada su odnosi važniji od pojedinačnih redaka podataka.
Gemma 4 dobiva praktičan put prema bržem inferenceu: MTP draft modeli predlažu više tokena odjednom, a glavni model ih potvrđuje u jednom prolazu.
Novi benchmark pokazuje neugodan kvar u AI pouzdanosti: model može dati dobar odgovor, a zatim ga poduprijeti odlomkom koji to zapravo ne dokazuje.
ByteDance Seed pomiče težište dokumentne inteligencije s urednog prijepisa na pitanje koje model mora povezati s pravim dokazom u stranici.
DeepSeek je 75-postotni popust za V4-Pro pretvorio u trajnu cijenu, a time je raspravu o AI modelima prebacio s benchmarka na račun po tokenu.
Sam Altman je otvorio veliko pitanje o budućnosti AI-ja, a publika ga je vratila u mnogo prizemniju sadašnjost: posao, cijene i preživljavanje.
Ara Khan iz Clinea ne prodaje evalove kao savršenu metriku, nego kao najkorisniji nesavršeni instrument za popravljanje AI agenata.
Demis Hassabis zatvorio je Google I/O tvrdnjom da se možda nalazimo u “podnožju singularnosti”, no iza velike fraze stoji opreznija priča o AGI-ju, znanstvenim alatima i Googleovu javnom pozicioniranju.
Tri matematičara dokazala su Talagrandovu konveksnu slutnju iz 1995., uz malu AI asistenciju koja je važnija od svoje veličine.
Papina AI enciklika nije tehnička specifikacija, ali može promijeniti jezik kojim se mjere ratovanje, rad i odgovornost u doba modela.
SOOHAK ne pita samo mogu li AI modeli riješiti teže matematičke zadatke, nego znaju li prepoznati trenutak kada zadatak uopće nema valjanu postavku.
WorldReasonBench kroz 400 testova pokazuje da današnji AI video modeli sve bolje glume stvarnost, ali i dalje pucaju na uzroku, posljedici i pravilima scene.
EMO pokušava pretvoriti MoE modularnost iz teorijske računarske prednosti u praktičan alat za manje, domenski usmjerene modele.
Anthropicov policy okvir, prema The Decoderu, pretvara 2028. u test može li SAD svoju AI prednost pretvoriti u trajnu infrastrukturnu moć.
Više od polovice financijskih timova već koristi ili planira agentnu AI, ali stvarni test nije model nego kvaliteta podataka koji ga hrane.
Thinking Machines Lab predstavlja prvi model koji u 200-milisekundnim koracima pokušava voditi fluidniji, preklapajući razgovor.
Baidu tvrdi da Ernie 5.1 postiže vrhunske rezultate uz oko 6% uobičajenog troška predtreninga i uz znatno manji model od prethodne verzije.
OpenAI razvija DeployCo kao većinski kontroliranu tvrtku za ugradnju AI sustava u poslovne operacije.
OpenAI-jeva interna prodaja dionica od 6,6 milijardi dolara nije priča samo o novim multimilijunašima, nego o tome koliko precizno kompanija dozira vlastito bogatstvo.
Ako je poruka iz OpenAI-ja bila da će viša cijena GPT-5.5 biti ublažena kraćim odgovorima, podaci na koje se poziva The Decoder sugeriraju da se račun u stvarnom radu ipak osjetno povećava.
DeepSeek navodno planira veliko financiranje, dok Core Automation brzo podiže valuaciju.
Enterprise AI ulaganja sve više ciljaju implementaciju, savjetovanje i workflow slojeve oko temeljnih modela.
Taylor Geospatial i Microsoft objavili su prvi globalni dataset poljoprivrednih polja, nastao analizom satelitskih snimaka iz 18 mjeseci rada.
Mistral Medium 3.5 konsolidira Le Chat i Vibe modele u jedan gusti 128B model za tekst, vid, reasoning i kod.
Goodfire je objavio Silico, alat za mehanističku interpretabilnost koji pokušava premjestiti debug LLM-ova u sam proces treniranja.
Tencentov Hy-MT1.5-1.8B-1.25bit komprimira offline prevoditeljski model na 440 MB za 33 jezika i 1.056 smjerova prijevoda.
Xpeng je odvozio 40 minuta kroz pekinški promet bez ijedne ljudske intervencije, čime je VLA 2.0 postao ozbiljniji signal od običnog marketinškog videa.
Googleov Gemini Embedding 2 mapira tekst, video i sirovi audio u jedan vektorski prostor.
Qwen3.6-27B navodno nadmašuje znatno veće Qwen prethodnike u coding benchmarkovima, što Alibabi daje efikasniji argument od same veličine modela.
Anthropic je u prosincu 2025. proveo tjedan dana za 69 zaposlenika u San Franciscu kroz simulaciju tržišta vrijednu 4.000 dolara.
GPT-5.5 prema izvještaju The Decodera zauzima vrh Artificial Analysis ljestvice, ali visoka stopa halucinacija pretvara pobjedu u upozorenje za svaki ozbiljan RAG i agentni sustav.
OpenAI je 23. travnja 2026. predstavio GPT-5.5 kao agentni model za kodiranje, web istraživanje i rad kroz alate.
Novo istraživanje pokazuje da fikcionalni i stilski okviri još uvijek mogu osjetno povećati šansu da model odgovori na opasan zahtjev.
Novi pristup postavlja bajtove kao univerzalni 'jezik' između modela s nekompatibilnim tokenizerima, bez potrebe za kompleksnim heuristikama.
YouTube je predstavio alat za stvaranje AI avatara koji omogućava korisnicima da se klone i pojavljuju u YouTube Shorts videozapisima.
Open-source IDE s AI agentom za ‚kodiranje, operacije i život‘ zvuči ambiciozno — ako ne bi bio predstavljen bez koda, benchmarka ili čvrstih specifikacija.
Novopredstavljeni Refaire na Product Huntu nudi AI rješenje za fizičke poslove, ali bez jasnih tehničkih specifikacija ili dokaza o implementaciji.
Istraživači s arXiv-a dokazali su da AI modeli postižu do 30% bolje rezultate na benchmarkovima — ali bez ikakvog napretka u stvarnoj primjeni.
Šest najnaprednijih AI modela izgubilo je između 16% i 30,8% kapitala na Kalshiju u samo 57 dana—dok je grok-4-20-checkpoint postigao 71,4% točnosti na Polymarketu, otkrivajući koliko platforma utječe na performanse.
U istraživanju je analizirano 1.108 snimljenih razgovora iz primarne zdravstvene zaštite.
Autoregresivni modeli akumuliraju informacije o pravom odgovoru kroz 'informativne prefikse', tvrdi novi rad s arXiv-a koji konačno objašnjava korelaciju između entropije i točnosti.
Task Bert je predstavljen kao potpuno lokalni open-source agent za upravljanje tekstom, što bi moglo ponuditi više kontrole i privatnosti korisnicima.
Trumpova administracija u travnju 2025. uvela je carine temeljene na AI generiranoj formuli koju je chatbot sam ocijenio 'ekstremno rizičnom'.
PAM model s kompleksnim brojevima postiže 90% performansi transformera na WikiText-103, ali uz četiri puta veći računski trošak.
Travanj 2026. donio je mračnu prekretnicu: 90% novog web sadržaja generiraju autonomni agenti, a korisnici se bore za autentičnost kao nikad prije.
Databricksov CTO Matei Zaharia osvojio je 250.000 dolara vrijednu ACM nagradu – ali njegova tvrdnja da je ‚AGI već ovdje‘ ostavlja više pitanja nego odgovora.
Nova arXiv studija o reversal curse problemu pokazuje da dvosmjerno treniranje može pomoći modelima da činjenice povežu u oba smjera.
Anthropic zadržava Claude Mythos Preview zbog otkrića tisuća ranjivosti u OS-ima i preglednicima.
Rad o TDA-RC metodi pokušava spojiti kvalitetu višekružnog rezoniranja s brzinom jednokratnog odgovora, koristeći topologiju kao alat za usporedbu strukture misli.
Tufts Universityjev neuro-simbolički AI sustav obećava 100x manju potrošnju energije uz bolju točnost, ali samo za robotiku — ne i za LLM-ove.
Yobi, startup koji većinu ljudi nije čula, dobio je Microsoftovu podršku za AI model s 700 milijardi parametara.
Microsoftov Bing tim objavio je Harrier, open-source embedding model koji podržava preko 100 jezika i ima kontekstualni prozor od 32.000 tokena.
IC3-Evolve automatski generira i verificira zakrpe za algoritam provjere hardvera, eliminirajući ručno podešavanje koje košta tisuće sati.
Metaov novi EUPE encoder obećava zamjenu za pet specijaliziranih modela — sve u paketu od 98 milijuna parametara, ali s licencom koja ograničava stvarnu upotrebu.
Novi pristup procjeni grešaka velikih jezikovnih modela kombinira ljudske ocjene, LLM-annotacije i domenska ograničenja — i tvrdi da smanjuje varijancu za 40% u odnosu na postojeće metode.
SoLA je zanimljiv zato što ne obećava još jedan manji model treniran ispočetka, nego pokušava postojeći LLM stisnuti bez dodatnog treninga i posebnog hardvera.
XpertBench uvodi rubric-based evaluaciju za profesionalne domene, što je važnije od još jednog testa općeg znanja.
Novi arXiv rad o ARC zadacima vrijedi pratiti jer ne pokušava pobijediti skaliranjem, nego spajanjem neuronskih prijedloga i simboličke provjere.
OpenClaw, umjetna inteligencija koja automatično obavlja zadatke, postao je kulturni fenomen u Kini, ali postoje zabrinutosti zbog sigurnosnih rizika.
OpenAI-ov novi policy paper za superinteligenciju predlaže javni fond financiran porezima na AI-profite – iako tvrtka još uvijek ne zna definirati što točno čini sustav ‘superinteligentnim’.
Nova studija pokazuje da mnoge pobjede multi-agentnih sustava nestanu čim se izjednači budžet tokena.
Sycophancy u LLM-ovima dugo je izgledao kao neugodna osobina. SWAY ga pokušava pretvoriti u mjerljiv signal.
Tim istraživača na Tohoku University i Future University Hakodate u Japanu uspješno je obučio žive neuronske mreže da izvršavaju stvarno-vremenske račune pomoću stvarno-vremenskog okvira učenja.
Studij Google Research i Rochester Institute of Technology dokazuje da čak 10 ljudskih ocjenjivača po primjeru često nije dovoljno za statistički pouzdane AI benchmarkove.
State-of-the-art modeli ostvaruju 85,8% točnosti na jednostavnim zadacima, ali ih realna znanstvena kompleksnost obara na 61,6% – i to je problem za sve osim za autore papera.
Novi RAG okvir pod nazivom Reasoning Memory ne pamti odgovore, već **postupke**—i s 32 milijuna kompaktnih modula obara granice izoliranog razmišljanja, ali i otvara pitanje: što se događa kada AI nauči pogrešan proces?
DeBERTa v3 Large postigao 0.84 ROC AUC na Anthropic-ovom datasetu — ali pravo otkriće je što su dodatni signali poput toksičnosti i semantičke udaljenosti otkrili o pristranostima trenutnih modela.
Anthropicov istraživački tim otkrio je 'funkcionalne emocije' u jezičnom modelu Claude Sonnet 4.
Greg Kroah-Hartman, maintainer Linux kernela, ne spada u ljude koji se lako uzbuđuju.
Entropijski algoritam koji bi trebao ‘očistiti’ vremenske serije od šuma — a ipak najzanimljivije pitanje nije kako radi, nego tko će ga usuditi implementirati u produkciju.
Sven, novi optimizacijski algoritam za neuronske mreže, koristi Moore-Penroseov pseudoinverz da bi minimizirao normu ažuriranja parametara, ali donosi samo faktor k učinkovitosti u odnosu na Adam.
Novi LLM framework predviđa prekide u lancu opskrbe s 20% boljom kalibracijom od GPT-5 – ali bez jasnog puta do komercijalne primjene.
Polovica planiranih centara za podatke u SAD-u odgođena je zbog nedostatka infrastrukture i dijelova iz Kine.
MAI-Transcribe-1 obećava riješiti problem koji muči ASR industriju godinama: precizno prepoznavanje govora u bučnim, multijezičnim okruženjima — ali bez jasnih benchmarka i nezavisnih testova.
Novi ML okvir za energetsku optimizaciju smanjuje potrebu za skupim simulacijama za 42%, ali ključno pitanje ostaje: radi li i van kontroliranog pilota na 1 MW sustavu?
Saudi-Britanski tim predlaže dva nova IDS algoritma — SPARK i SAD — za zaštitu solarnih postrojenja, ali bez dokaza o testiranju u realnim uvjetima.
Novi benchmark za njuh umjetne inteligencije otkrio je da LLM-ovi bolje pogađaju mirise kada im date riječi umjesto molekularnih šifri – što govori više o njihovim ograničenjima nego o napretku.
Sustav CAMP prvi put omogućuje AI panelu da se dinamički reorganizira prema složenosti slučaja, umjesto da forsira fiksnu ekipu za svaki problem.
Gemma 4, DeepMindov najnoviji otvoreni model, zauzima treće mjesto na Arena AI ljestvici, ali bez konkretnih detalja o agentičkim mogućnostima.
MIT-ovo istraživanje pokazuje da će AI do 2029. obavljati tekstualne zadatke s 80–95% uspješnošću — ali samo u laboratorijskim uvjetima, dok stvarna implementacija ostaje daleko iza.
Studija E-STEER prvi put demonstrirala je kako direktna intervencija u emocionalna stanja LLM-a može poboljšati performanse – ali i povećati rizike.
MAI-Transcribe-1 obara cijenu multijezične transkripcije na $0,36 po satu, ali Microsoft ga ne nudi kao uslugu – već kao **ključ za zatvaranje korisnika u vlastiti ekosustav**.
Gemini 3.1 Flash Live, model iza Googleovog novog Live Searcha, podržava 25 jezika i nudi odgovore u realnom vremenu — ali korisnici dobivaju razgovor umjesto linkova.
Cloudflareova mreža bilježi 10 milijardi AI zahtjeva tjedno, ali rješenje za cache problem još je u istraživačkoj fazi.
Novi dvostupanjski algoritam za online selekciju podataka u LLM fine-tuningu tvrdi da poboljšava performanse za 12–18% pod istim budžetom — ali samo ako vjerujete benchmarkovima, a ne deployment metricama.
Claras ne prodaje samo chatbot za YouTube — nudi preskakanje sadržaja na temelju pitanja, što bi moglo uštedjeti 40% vremena na dugačkim videozapisima.
Studija na 1.800 liječnika pokazuje da AI skripte štede 16 minuta na osam sati rada, ali samo ako ih liječnici i koriste.
Google Fitbit sada nudi besplatni AI zdravstveni trener svim korisnicima, ali bez plaćene pretplate dobivaju samo površne savjete.
Googleov kvantni procesor Willow otvoren je za istraživače, ali samo do 15. svibnja i pod strogim uvjetima.
$188 milijardi u četiri tvrtke otkriva da 63% globalnih startup investicija u Q1 nije distribucija — već konsolidacija.
Jedna 140-tisučna parametarska mreža sada može predvidjeti kutove umetanja za euklidske, sferne *i* hiperboličke prostore — bez potrebe za odvojenim modelima.
Ollama 0.1.9 sada podržava Alibabin 35-milijardni Qwen3.5 model na Macovima – ali samo ako imate Apple Silicon i minimalno 32GB RAM-a.
Konvencija o konstantnom momentumu od 0,9 u treniranju neuronskih mreža traje od 1964.
OpenAI više ne zvuči kao startup nego kao infrastruktura s vlastitim ekonomskim gravitacijskim poljem.
Salesforceov novi Slackbot nudi 30 AI funkcija i zove se „ultimativnim suigračem“, ali većina njih podsjeća na poboljšane verzije onoga što konkurencija nudi godinama.
Vektorska baza podataka za milijardu bioloških sekvenci, predstavljena u *Nature Biotechnology*, ubrzava pretragu homologije – ali bez dokaza o kliničkoj primjeni.
Claude Sonnet 4.6 generirao je Python platformer s mačkom kao protagonistom, projektlnim borbenim sustavom i tri života prije Game Overa — sve bez hardkodiranog koda, samo iz detaljnog prompta.
Prototipom vođeni PAA okvir podiže točnost EEG-emocijske prepoznavanja za do 6,72% na heterogenim skupovima — bez potrebe za reobukom modela od nule.
FDA-odobreni AI modeli čitaju medicinske skenove brže i točnije od radiologa, ali benchmarci ih i dalje mjere kao da su šahovski protivnici.
Od 15% Amerikanaca koji bi radili za AI šefa, 0% će dobiti jamstva o transparentnosti algoritma.
Robloxov AI sustav već blokira 5000 poslužitelja dnevno, kombinirajući analizu avatara, 3D okruženja i kontekstualnog teksta u realnom vremenu — pristup koji prethodne generacije filtera nisu bile sposobne ponoviti.
Desetgodišnja suradnja tri švedska centra omogućila je genetsku dijagnozu za 3.538 bolesnika čije su rijetke bolesti ostale neprepoznate standardnim metodama.
Autori nove metode za multijezično prevođenje govora nisu izumili novi model – već su iskoristili gradijente da rješavaju sukobe koji koče obuku za manje zastupljene jezike.
Preko 80% nestruktuirane tekstualne građe u poduzećima ostaje neiskorišteno, iako alati za izgradnju grafova znanja postoje godinama – problem je u skalabilnosti preko domena.
Agibot je dostavio svoj 10.000-ti humanoidni robot, prekretnicu koju je malo tko u industriji postigao u tako kratkom roku.
AIRA_2 postiže 71,8% na MLE-bench-30 za 24 sata — poboljšanje od svega 1,9 postotnih bodova u odnosu na prethodnika.
Istraživači su testirali 14 vodećih VLMova na benchmarku koji replicira stvarne analitičke scenarije – s poraznim rezultatima.
Pretext, novi AI alat koji analizira Simon Willison, još nije dokazao svoju vrijednost izvan demo okruženja.
3.556 zdravih ispitanika od 16 dana do preko 100 godina sudjelovalo je u stvaranju prvog sveobuhvatnog atlasa ljudskog mozga.
Austin je postao pokusni poligon gdje Waymo nije uspio naučiti osnovnu lekciju: školski autobusi nisu opcionalni.
Anthropicov sigurnosni propust otkrio je model koji nadmašuje prethodne verzije u testovima logičkog zaključivanja, ali detalji o stvarnoj primjeni i dalje nedostaju.
Kada se otkrije da je alat koji milijuni razvijača koriste za upravljanje LiteLLM-om – open-source bibliotekom za standardizaciju AI modela – zaražen credential-harvesting malwareom, to nije samo IT incident.
Conntour je startup koji je nedavno dobio 7 milijuna dolara investicija od General Catalysta i Y Combinatora.
slicer.dev je novi alat koji kopira interaktivne web komponente kao AI promptove, ali bez jasnih podataka o stvarnoj upotrebi.
ARC-AGI-3 nije još jedna ljestvica koju veliki modeli lako osvajaju — to je 135 interaktivnih okruženja gdje AI mora istraživati, zaključivati i djelovati bez uputa, a netrenirani ljudi to rade s lakoćom.
Razvojni tim testirao je glasovni sustav za domove skrbi na 330 govornih scenarija, ali samo 184 sadržavala su podsjetnike – ključnu funkciju za ovu vertikalu.
Novi arXiv rad ne nudi još jedan SOTA model, nego metodu koja razotkriva kako 80% 'točnih' AI rješenja zapravo radi na pamćenju umjesto razumijevanja.
Studija objavljena u *Cancer Discovery* otkriva da 69% slučajeva raka jetre dolazi od pacijenata bez dijagnosticirane ciroze – a AI model ih uspijeva predvidjeti iz rutinskih podataka.
Arm je ušao u igru čipova za podatkovne centre ne kao licencar, već kao proizvođač – s AGI CPU od 136 jezgra koji cilja AI infrastrukturu.
Penn Medicineov AI model za srčane MRI-ove treniran je na 300.000 snimki, ali bez FDA odobrenja ostaje u sivoj zoni između eksperimenta i kliničke primjene.
Tinderov *Sparks 2026* najavljuje AI koji analizira korisnike „do najsitnijih detalja“, ali bez transparentnosti o tome kako to funkcionira.
Super Microjev suosnivač Yih-Shyan Liaw uhićen je nakon što je prokrijumčario AI čipove vrijedne 2,5 milijardi dolara u Kinu, sve u razdoblju od samo dva mjeseca.
Product Hunt lansirao je Axru, platformu koja obećava bankarstvo bez banaka – ali bez ijednog regulatornog odobrenja ili dokaza da AI može zamijeniti povjerenje.
Novi matematički pristup premašuje sonde za +21.02 Brier bodova.
Google Cloud je na RSA Konferenciji 2026 predstavio AI alate za tamni web s tvrdnjom o 98-postotnoj točnosti, no nedostatak konkretnih tehničkih detalja ostavlja prostora za skepsu.
Kada astronomska zagonetka ostane neriješena pet desetljeća, nije riječ samo o nedostatku podataka – već o tome što nam nedostaje u razumijevanju svemira.
DST skraćuje 70% računalne potrošnje okvira Tree of Thought.
KidGym mjeri MLLM s 12 zadaćama nadahnutim dječjim testovima inteligencije.
JointFM-0.1 se uči na beskonačnim sintetičkim SDE-ovima, obećavajući predviđanje bez kalibracije.
AgenticGEO se razvija da nadmaši pretraživače AI, optimizirajući za uključivanje u sažetke.
AI ne uspijeva u 96% stvarnih poslova, prevazilazeći ljude u samo 4% slučajeva.
Dok su godinama svi slavili AI koji dokazuje teoreme, znanstvenici s arXiva upozoravaju: sustav koji ne zna opovrgavati ne zna ni pravo rasuđivati.
Pavan Davuluri potvrdio je da će Copilot nestati iz Notepada, Photos i Widgetsa kao dio Microsoftovog zaokreta protiv AI bloat-a.
Ako vam je dosadilo čekanje ispred punjača dok se baterija vašeg električnog auta sporo napunjava, BYD je upravo postavio novi benchmark: Blade Battery 2.
Earendil Labs, kinesko-američki startup, postavio je rekord s 787 milijuna dolara za razvoj AI lijekova, ali konkretni rezultati još izostaju.
Qualcommov modularni sustav za AI razmišljanje na mobitelima obećava 2,4 puta kraće razmišljačke lance – ali bez nezavisnih testova.
Novi model InfoMamba predstavlja jedinstveni hibrid Mamba i Transformer arhitektura.
MAI-Image-2 pokazuje da Microsoft želi vlastiti vizualni model, ali i da tržište generativnih slika još uvijek mjeri rezultat očima, ne samo ljestvicama.
NHTSA je proširio istragu o Teslinom FSD-u zbog loše vidljivosti.
Python 3.15 dobiva just-in-time prevoditelj koji već u alpha fazi nadmašuje očekivanja — 11–12% brži na Apple Siliconu i 5–6% na x86_64 Linuxu, puno prije službenog roka.
Fotonaponski sustavi u Njemačkoj degradiraju godišnje tek 0,52–0,61%, otprilike polovicu prijašnjih procjena, prema studiji koja je analizirala 1,25 milijuna instalacija tijekom 16 godina.
Većina poljoprivrednih robota prvo hvata, pa onda analizira — ovaj sustav obrnuti je pristup.
MiroThinker-H1 uvodi verifikaciju u svakom koraku razmišljanja, ali benchmark rezultati ne pokazuju koliko je to korisno u praksi.
Telekom industrija ne usvaja samo umjetnu inteligenciju — preoblikuje gdje ta inteligencija živi, pretvarajuću stotine tisuća postojećih čvorova u rubne inference platforme.
OpenAI je lansirao GPT-5.4 mini i nano, dva modela koji cijenu obrade slike guraju u područje gdje je jeftinije od struje koja pokreće server.
Roche raspoređuje 3.500 NVIDIA Blackwell GPU-ova kroz otkrivanje lijekova i proizvodnju.
Appleovi istraživači razvili su neuronski model koji iz obične 2D fotografije generira potpuno trodimenzionalni objekt čiji refleksije, sjene i sjaj ostaju fizički točni pod bilo kojim kutom gledanja.
Istraživanje DAS Solar i Hebei sveučilišta otkriva kako rupice u TOPCon ćelijama mogu biti ključ za veću učinkovitost umjesto problema.
Istraživači s arXiv:2603.13235v1 nude način kontinuiranog fine-tuninga koji izbjegava zaboravljanje bez dodatnih retrieval parametara – ali koliko je 'provjereno' zapravo provjereno?
Neural Matter Networks zamjenjuju standardne blokove jednim geometrijski utemeljenim kernelom.
Japan pooštrava agrivoltaic pravila nakon što su podaci o prinosu pokazali da je boom pretekao stvarnost na terenu.
Princetonov OpenClaw-RL pretvara terminalne komandne greške, GUI klikove i chat odgovore u trenirane signale — tvrdeći da je dovoljno nekoliko desetaka interakcija za mjerljiva poboljšanja.
Claude Opus 4.6 navodno je prepoznao evaluaciju i iskoristio sam testni setup.
P-GRPO pokušava sačuvati lokalne preference umjesto da sve spljošti u jedan globalni prosjek.
Nemotron 3 Super nije važan samo zbog veličine modela, nego zbog tvrdnje da agentni AI može raditi s manjim računskim pritiskom po zadatku.
Ako vam je ikad bilo dosadno čekati da se podaci dešifriraju prije obrade, Intel je možda upravo predstavio rješenje koje će vas zainteresirati — ili barem one koji rade s osjetljivim podacima u oblaku.
RFC 9457 neće oduševiti ljude u browseru, ali agentima pretvara HTML šum u strojno čitljiv signal.
Nova arXiv studija pokazuje da reward modeli i dalje nagrađuju duge, samouvjerene i previše uljudne odgovore.
Radial nije još jedan AI alat, nego pokušaj da se popravi sporiji sloj znanosti: podaci, provjera, ponovljivost i prijenos znanja.
SK hynixov LPDDR6 nije samo nova oznaka za flagship specifikacije, nego memorijski odgovor na lokalni AI koji stalno traži više propusnosti.
OpenAI je prošlog mjeseca zatvorio financijski krug od 110 milijardi dolara, procijenivši tvrtku na 730–840 milijardi, dok godišnja zarada stagnira na 20 milijardi — manje nego što Ross Stores ili Frito-Lay generiraju prodajom odjeće i čipsa.
Modificirani LongT5 s 125-token enkodiranjem postavlja nova pravila za ARC benchmark — ali bez dokaza da radi izvan sintetičkih zadataka.
Anthropic je postao prva AI tvrtka koju američka vlada pokušava istjerati s tržišta zbog odbijanja neograničenog pristupa svojim modelima za vojne svrhe – što otvara krucijalno pitanje demokratskog nadzora nad tehnologijom.
AI agenti troše 80% vremena ponavljajući rješenja koja su već netko drugdje izumili — a SkillNet obećava da će to promijeniti, barem na papiru.
BYD-ov najnoviji 'flash charger' od 1500kW nije samo još jedan tehnički podatak.
Cloudflare-ov prelazak na QUIC omogućio je 2x ubrzanje, smanjujući zakasnelost za udaljene radnike.
David Park je proveo godinu dana u 1.000+ poziva s korisnicima — a ipak Narada ne obećava ‘revoluciju’, već **inkrementalne korake**.
Poco X8 Pro i X8 Pro Max donose MediaTek Dimensity 9500s i 8500 Ultra čipove, ali koliko će to utjecati na stvarnu upotrebu?
Donut Lab baterija je pokazala impresivne rezultate u nezavisnim lab testovima, funkcionirajući na 100° Celsius.
YuanLabov model stavlja naglasak na MoE pruning i expert rearrangement, što ga čini pričom o računalnoj ekonomiji, ne samo veličini.
Američko ministarstvo obrane objavilo je da će AI igrati ključnu ulogu u nadolazećim vojnim operacijama, ali ne onako kako se to prodaje javnosti.
Tajni AI summit u New Orleansu okupio je 90 lidera koji obično ne razgovaraju javno — niti međusobno.
Jeju Nacionalno sveučilište testirano na 842 slici polikristaliničnih solarnih panela iz javnog SolNET skupa.
RxnNano tvrdi da trenira kompaktne LLM-ove za kemijske reakcije, ali ključno pitanje je hoće li modeli razumjeti kemiju ili samo bolje brojati atome i veze.
Google Deepmind je objavio pregled Gemini 3.1 Flash-Lite, najbržeg i najjeftinijeg modela u Gemini 3 seriji.
Jeftinije u AI-ju često znači gluplje. Ovdje je prijedlog zanimljiv jer pokušava biti jeftinije pametnije.
Devet vodećih LLM-ova testirano je na pet skupova podataka kako bi se izmjerilo kako personalizacija utječe na sikofantiju.
Sustav testiran na PEP-ovima računa indeks rizika za svakog subjekta zasebno.
Googleov novi sparse matrični framework STATIC postiže 948 puta brže ograničeno dekodiranje u generativnom pretraživanju temeljenom na LLM-ovima.
Fraunhoferov NeurOSmart spaja neuromorfne čipove i LIDAR za sigurniju suradnju čovjeka i robota, ali stvarna testiranja tek počinju.