Matinding kritisismo ang natatanggap ngayon ng Claude Fable 5 ng Anthropic matapos itong i-re-release ngayong July 1. Sabi ng mga user, sobrang higpit ng bagong guardrails kaya halos na-paralyze yung kakayahan nito sa coding, debugging, at sa pagiging agentic ng model na ‘to.
Ibinahagi ng benchmarking group na BridgeMind na sobrang bumagsak ang scores ng Claude Fable 5 sa BridgeBench tests nila. Pero giit ng Anthropic, hindi daw talaga nagbago yung model mismo at sinisisi nila yung nangyaring problema sa mas mahigpit na safety classifiers.
Bagsak ang Claude Fable 5 Benchmark Scores Pagkatapos ng Re-Release
Inulit ng BridgeMind ang testing gamit ang July 1 version ng Fable 5 at nakita nilang bagsak nga ang scores. Mula 86.2, naging 25.9 na lang ang debugging. Mula 73.6, bumagsak sa 38.4 ang refactoring. At yung sa hallucination handling, bumaba from 75.9 to 61.7.
Mahalaga kung paano nakuha yung mga numbers na yan. Sa 12 debugging tasks, 3 lang yung natapos nang hindi nilipat sa Claude Opus 4.8. Lahat ng nilipat, bagsak, as in zero ang score.
Ibig sabihin, yung pagbagsak ng scores ay dahil may mga task na naharang, hindi dahil humina yung reasoning ng model.
Binigyang-diin pa ng BridgeMind na kapag natapos ang isang task, halos kapareho pa rin ng June version yung Fable 5 pagdating sa output.
“Hindi talaga humina yung model. Ang nangyari, para itong nakulong,” sabi nila sa isang post.
I-follow kami sa X para laging updated ka sa crypto news!
Klaro na ang history ng modelo kung bakit nagkaroon ng gulo. Nag-launch ang Anthropic ng Fable 5 noong June 9, pero tinanggal ito agad sa US servers pagkaraan ng tatlong araw. Noong June 30, tinanggal ng regulators ang export controls nito, apat na araw matapos ibalik yung Mythos 5 access sa nasa 100 US institutions.
Pero kahit bumalik na ang access, may limitations pa rin. Puwede lang magamit ang Fable 5 hanggang 50% ng lingguhang usage cap hanggang July 7. Pagkatapos nun, kailangan nang gumamit ng paid credits.
Depensa ng Anthropic: Mas Malawak na Safety Margin Para Mas Safe
Sinagot ng Anthropic ang issue sa isang statement noong June 30. Sabi nila, sinadyang palawakin ang safety margin kaya madalas na ngayon na na-bblock yung requests kahit benign o okay naman. Mas okay na raw ang filter nila, kaya ‘di na gumagana ang mga bypass technique — ayon sa Amazon researchers, mahigit 99% ng attempts ay naharang na.
Kapag nablock ang request, automatic napupunta ito sa Opus 4.8 at may notification na lalabas. Pero inamin ng Anthropic na yung bagong filter, mas marami na ring nai-flag na legal na coding at debugging tasks.
Sa sariling tests ng Anthropic, lumabas na wala namang unique risk ang Fable 5. Yung mga kalabang model tulad ng GPT-5.5 at Kimi K2.7, nakita ring may parehong vulnerabilities.
Kwento ng Anthropic, mismong researchers ng US Commerce Department ang nag-test ng dalawang safety system, at pareho raw solid yung feedback dito.
Umaabot pa sa iba’t ibang bansa ang epekto ng suspensyon ng Claude Fable 5. Habang pinatigil ito sa US, lumapit ang Europe sa Anthropic, at umaarangkada rin ang mga Chinese AI model laban sa US labs.
Ngayon, nagtutulungan na ang Anthropic kasama sina Amazon, Microsoft, at Google para gumawa ng measuring system sa severity ng jailbreaking. Abangan kung magiging mabilis ang adjustment ng classifiers — dito malalaman kung mananatili ang mga power user o lilipat na sila sa iba.









