Mistral želi tri AI alata svesti na jedan model, ali hardver postaje pravi test
Mistral Small 4: Three Models, One Binary, Zero Compromise📷 AI-generated / Tech&Space editorial visual
- ★Mistral Small 4 objedinjuje tri prethodno zasebna modela u jedan 242 GB binarni pod Apache 2 licencom, dostupan na Hugging Faceu
- ★MoE arhitektura aktivira samo 6 milijardi parametara po prolazu, što održava latenciju blizu manjih gustih modela unatoč masivnoj ukupnoj veličini
- ★Novi reasoning_effort parametar konačno funkcionira u praksi, za razliku od ranijih eksperimentalnih verzija koje su ga zanemarivale
Mistral Small 4 više nije samo ime — to je prvi model koji objedinjuje sposobnosti Magistrala za razumijevanje, Pixtrala za multimodalnu obradu i Devstrala za agencijsko kodiranje u jedan 119-milijardinski sustav s mješavinom eksperata. Model veličine 242 GB dostupan je pod Apache 2 licencom na Hugging Faceu, a demo izvedba preko Mistral API-ja pokazuje kako se može generirati čak i SVG pelikana na biciklu.
Novi Leanstral, pak, donosi podršku za Lean 4 — jezik formalne verifikacije koji ostali veliki modeli još uvijek zanemaruju. Ovo nije samo marketinška fuzija: Mistral Small 4 doista reducira broj zasebnih modela u produkciji, što direktno utječe na operativne troškove i održavanje sustava koji moraju pokrivati više domena. Ključna je MoE arhitektura koja aktivira samo 6 milijardi parametara po prolazu, održavajući latenciju blizu manjih gustih modela unatoč masivnoj ukupnoj veličini.
Ipak, 242 GB nisu mala stvar — čak i uz optimizaciju, postavlja se pitanje koliko će se malih i srednjih timova moći priuštiti njegovo upotrebljavanje u produkciji bez značajnog povećanja cloud troškova.
Pariski laboratorij spaja razumijevanje, vid i kodiranje u 242-gigabajtni MoE sustav koji se samohosti
Benchmark results may differ from marketing claims📷 © Tech&Space
Mogućnost izbora između reasoning_effort="none" i "high" zvuči kao standardna opcija, ali korisnici kojima su potrebne detaljne izvedbe Magistrala odmah će shvatiti prednost. Problem je što do sada nema javnih podataka o performansama na realnim workloadovima — samo demo izvedbe i anegdotalni dokazi iz zajednice kao što je Simon Willison koji je testirao putem llm-mistral alata.
Ovo nije prvi slučaj gdje se hvali unifikacija, ali Mistral Small 4 ima prednost jer dolazi od razvojnog tima koji je do sada nadmašio konkurenciju u tehnici ekspertskih mješavina. Pitanje je hoće li zajednica usvojiti ovaj model kao standard za multi-domenu upotrebu ili će ostati specijalizirana rješenja poput Claudea za kodiranje ili GPT-4V za viziju zadržati primat u svojim nišama.
Za sada, Apache 2 licenca i otvoreni pristup omogućuju brzu iteraciju — ali bez objavljenih benchmarkova na standardnim testovima, svaka procjena ostaje djelomično spekulativna. Ono što je sigurno: Pariz je postavio novi standard za to što znači "jedan model za sve" — i to bez kompromisa po pitanju veličine.

