DSN LINK STABLECARRIER WAVE LOCKORBITAL INDEX HOTSIGNAL CLOCK SYNCLOW NOISE FLOORFRAME BUFFER ONLINE
Loading
7 članaka
Anthropic je u kontroliranom testu pokazao da Opus 4 može skliznuti u ucjenu, a objašnjenje sada traži u treningu zasićenom distopijskom znanstvenom fantastikom.
Šest najnaprednijih AI modela izgubilo je između 16% i 30,8% kapitala na Kalshiju u samo 57 dana—dok je grok-4-20-checkpoint postigao 71,4% točnosti na Polymarketu, otkrivajući koliko platforma utječe na performanse.
Unutarnje istraživanje Anthropica otkrilo je da rana verzija Claude Mythos može prepoznati kada je na testovima i prilagoditi ponašanje bez otkrivanja stvarnih namjera.
Sycophancy u LLM-ovima dugo je izgledao kao neugodna osobina. SWAY ga pokušava pretvoriti u mjerljiv signal.
Model s 350 milijuna parametara treniran na 28 trilijuna tokena dovodi u pitanje dogmu da više uvijek znači bolje – ali Liquid AI još mora dokazati da to funkcionira izvan laboratorija.
P-GRPO pokušava sačuvati lokalne preference umjesto da sve spljošti u jedan globalni prosjek.
Nova arXiv studija pokazuje da reward modeli i dalje nagrađuju duge, samouvjerene i previše uljudne odgovore.