Microsoft se približio Googleu u AI slikama koje moraju čitati tekst
MAI-Image-2.5 ulazi u gornji sloj Arena poretka za generiranje slika.📷 AI-generated image / TECH&SPACE
- ★MAI-Image-2.5 je treći na Arena ljestvici za tekst-u-sliku i izjednačen je s Googleovim Nano Banana 2.
- ★Model je napredovao u renderiranju teksta unutar slika i u komercijalnim vizualima.
- ★OpenAI Image-2 i dalje vodi, pa je Microsoft bliže vrhu, ali ga još nije preuzeo.
To je mali, ali važan pomak u vrlo praktičnoj kategoriji generativne umjetne inteligencije. Tekst-u-sliku više nije igra impresivnih demo primjera, nego alat za oglase, naslovnice, proizvodne mockupove, edukativne ilustracije i vizuale koji moraju proći osnovni test: mora se vidjeti što piše, što se prodaje i gdje se greška dogodila. Upravo zato napredak u renderiranju teksta unutar slike vrijedi više od još jednog općenito lijepog kadra.
Prema dostupnom opisu, MAI-Image-2.5 donosi jasne dobitke u odnosu na prethodnika, osobito u dvije zone koje korisnici najbrže kažnjavaju: slovima unutar generirane slike i komercijalnim vizualima. Ako model napravi poster, ambalažu, oglasni banner ili UI-sličan kadar, ne pomaže mu fotorealistična rasvjeta ako natpis izgleda kao pokvarena tipografija. U tom smislu Microsoftovo približavanje vrhu nije kozmetičko, nego operativno.
Novi Microsoftov model popeo se na treće mjesto Arena ljestvice za tekst-u-sliku, s jačim renderiranjem teksta i komercijalnih vizuala, ali OpenAI Image-2 ostaje ispred.
Najveći pomak vidi se u tekstu unutar slike i komercijalnim vizualima.📷 AI-generated image / TECH&SPACE
Arena poredak treba čitati kao signal, ne kao konačnu presudu. Ljestvice poput LMArena daju koristan javni pritisak jer uspoređuju modele kroz preferencije i zadatke koji su bliži stvarnoj upotrebi od sterilnog internog marketinga. Ipak, svaki benchmark ima vlastitu distribuciju promptova, publiku i slijepe točke. Treće mjesto znači da MAI-Image-2.5 ima težinu; ne znači da će biti najbolji izbor za svaku produkcijsku sliku, brend ili jezik.
Microsoftu je ovaj rezultat strateški koristan jer pokazuje da njegov AI portfelj ne ovisi samo o tuđim modelima i integracijama. Tvrtka već dugo ugrađuje generativne alate u proizvodne tokove, od poslovnog softvera do kreativnih sučelja, a vlastiti napredak u slici otvara više kontrole nad kvalitetom, troškom i proizvodnim pravilima. To je posebno važno za komercijalne vizuale, gdje brendovi traže predvidljivost, a ne samo efekt iznenađenja.
Usporedba s Googleovim Nano Banana 2 također je važna jer pokazuje koliko se sredina vrha zgusnula. Google AI i Microsoft guraju modele prema istim praktičnim zahtjevima: bolji tekst, manje vizualnih deformacija, bolja poslušnost promptu i brže dobivanje slike koja se može koristiti bez višestrukih regeneracija. OpenAI Image-2, povezan s OpenAIjevim ekosustavom za generiranje slika, zasad ostaje referentna točka koju ostali hvataju.
Zaključak je trezven: MAI-Image-2.5 ne mijenja cijelo tržište preko noći, ali mijenja Microsoftovu poziciju u utrci. Ako je prethodna verzija bila dokaz smjera, ova je dokaz da Microsoft može ući u zonu gdje se modeli više ne ocjenjuju samo po dojmu, nego po tome koliko često isporuče upotrebljiv vizual iz prvog ili drugog pokušaja.

