Meta tag

Moe

11 članaka

EMO Cuts MoE Models Where Memory Hurts Most

db#4220

AI modeli bi mogli postati lakši ako nose samo module koji im stvarno trebaju

EMO pokušava pretvoriti MoE modularnost iz teorijske računarske prednosti u praktičan alat za manje, domenski usmjerene modele.

16 May 2026

DeepSeek V4 Tries to Sell Frontier AI at a Lower Price

Umjetna inteligencijaPrepravljeno

db#3363

DeepSeek pokušava promijeniti račun za duge AI zadatke

DeepSeek V4 stiže u Flash i Pro verziji s 1M-token context windowom, MoE arhitekturom i tvrdnjom da se približava vodećim zatvorenim modelima.

24 Apr 2026

Transformers are the new coal plants of AI

Umjetna inteligencija

db#2279

Transformeri su preskupi — što dolazi nakon njih?

Transformeri troše **33,634 Wh po upitu** — dovoljno da pokrenete tri pametna telefona svaki put kada chatbot razmisli.

09 Apr 2026

LiME cuts MoE fine-tuning bloat without cloning adapters

Umjetna inteligencijaPrepravljeno

db#3670

LiME pokazuje kako AI eksperti mogu učiti bez kopiranja adaptera

LiME koristi jedan dijeljeni PEFT modul i lake vektore eksperata kako bi smanjio MoE-PEFT parametre do četiri puta.

06 Apr 2026

Arcee’s Trinity: Open Reasoning or Just Open Marketing?

Umjetna inteligencija

db#1366

Trinity Large Thinking: 400 milijardi parametara i pravi test za agente

400 milijardi parametara u MoE arhitekturi s 4-of-256 rutiranjem čini Trinity Large Thinking najvećim otvorenim modelom za razmišljanje—ali aktivira samo 13 milijardi po koraku.

03 Apr 2026

Umjetna inteligencija

db#1283

Gemma 4: Googleov odgovor na inflaciju parametara

Googleov novi Gemma 4 nudi četiri multimodalna modela s vizualnim sposobnostima, ali pravi test bit će kako će PLE tehnologija funkcionirati izvan laboratorija.

02 Apr 2026

Umjetna inteligencija

db#667

1TB model na MacBooku: streaming eksperti mijenjaju pravila

MoE-ov model s 1 bilijunom parametara sada radi na MacBook Pro-u s 96GB.

24 Mar 2026

Mistral Small 4: Three Models, One Binary, Zero Compromise

Umjetna inteligencijaPrepravljeno

db#2906

Mistral želi tri AI alata svesti na jedan model, ali hardver postaje pravi test

Mistral je tiho isporučio Small 4, 119-milijardni MoE model koji objedinjuje Magistral, Pixtral i Devstral u jedan binarni s 6 milijardi aktivnih težina — i prvi put to zaista funkcionira u produkciji.

17 Mar 2026

Umjetna inteligencija

db#1520

MoE-SpAc: Spekulativna pamet protiv edge stiske

4.04x ubrzanje MoE modela na edge uređajima bez novog hardvera zvuči kao čarobnjakovo rješenje — sve dok ne pročitate da su benchmarkovi rađeni na *simuliranom* heterogenom okruženju.

12 Mar 2026

NVIDIA's 120B Mamba MoE Mix Tests If Open Source Can Keep Up

Umjetna inteligencijaPrepravljeno

db#3642

Otvoreni AI agenti dobivaju jači pogon, ali pravi test tek dolazi

Nemotron 3 Super spaja 120B parametara, Mambu i MoE za novu rundu otvorenih agenata.

11 Mar 2026

Yuan 3.0 Ultra sells MoE efficiency without magic

Umjetna inteligencijaPrepravljeno

db#3954

YuanLab obećava jeftiniji golemi AI, ali račun tek treba vidjeti

YuanLabov model stavlja naglasak na MoE pruning i expert rearrangement, što ga čini pričom o računalnoj ekonomiji, ne samo veličini.

05 Mar 2026

🇬🇧 EN

Meta tag

Moe

11 članaka

Umjetna inteligencijaPrepravljeno

db#4220

AI modeli bi mogli postati lakši ako nose samo module koji im stvarno trebaju

EMO pokušava pretvoriti MoE modularnost iz teorijske računarske prednosti u praktičan alat za manje, domenski usmjerene modele.

16 May 2026

Umjetna inteligencijaPrepravljeno

db#3363

DeepSeek pokušava promijeniti račun za duge AI zadatke

DeepSeek V4 stiže u Flash i Pro verziji s 1M-token context windowom, MoE arhitekturom i tvrdnjom da se približava vodećim zatvorenim modelima.

24 Apr 2026

Umjetna inteligencija

db#2279

Transformeri su preskupi — što dolazi nakon njih?

Transformeri troše **33,634 Wh po upitu** — dovoljno da pokrenete tri pametna telefona svaki put kada chatbot razmisli.

09 Apr 2026

Umjetna inteligencijaPrepravljeno

db#3670

LiME pokazuje kako AI eksperti mogu učiti bez kopiranja adaptera

LiME koristi jedan dijeljeni PEFT modul i lake vektore eksperata kako bi smanjio MoE-PEFT parametre do četiri puta.

06 Apr 2026

Umjetna inteligencija

db#1366

Trinity Large Thinking: 400 milijardi parametara i pravi test za agente

400 milijardi parametara u MoE arhitekturi s 4-of-256 rutiranjem čini Trinity Large Thinking najvećim otvorenim modelom za razmišljanje—ali aktivira samo 13 milijardi po koraku.

03 Apr 2026

Umjetna inteligencija

db#1283

Gemma 4: Googleov odgovor na inflaciju parametara

Googleov novi Gemma 4 nudi četiri multimodalna modela s vizualnim sposobnostima, ali pravi test bit će kako će PLE tehnologija funkcionirati izvan laboratorija.

02 Apr 2026

Umjetna inteligencija

db#667

1TB model na MacBooku: streaming eksperti mijenjaju pravila

MoE-ov model s 1 bilijunom parametara sada radi na MacBook Pro-u s 96GB.

24 Mar 2026

Umjetna inteligencijaPrepravljeno

db#2906

Mistral želi tri AI alata svesti na jedan model, ali hardver postaje pravi test

17 Mar 2026

Umjetna inteligencija

db#1520

MoE-SpAc: Spekulativna pamet protiv edge stiske

4.04x ubrzanje MoE modela na edge uređajima bez novog hardvera zvuči kao čarobnjakovo rješenje — sve dok ne pročitate da su benchmarkovi rađeni na *simuliranom* heterogenom okruženju.

12 Mar 2026

Umjetna inteligencijaPrepravljeno

db#3642

Otvoreni AI agenti dobivaju jači pogon, ali pravi test tek dolazi

Nemotron 3 Super spaja 120B parametara, Mambu i MoE za novu rundu otvorenih agenata.

11 Mar 2026

Umjetna inteligencijaPrepravljeno

db#3954

YuanLab obećava jeftiniji golemi AI, ali račun tek treba vidjeti

YuanLabov model stavlja naglasak na MoE pruning i expert rearrangement, što ga čini pričom o računalnoj ekonomiji, ne samo veličini.

05 Mar 2026