Claude Mythos, Napa-solve ang 73% ng Cyber Tasks na Hindi Kinaya ng Ibang AI Dati

  • Claude Mythos Preview: Unang AI na Natapos ang Simulated Corporate Cyberattack
  • Na-solve nito ang 73% ng matitinding hacking challenge na ‘di kayang lagpasan ng AI bago mag-2025.
  • In-announce ng Anthropic ang Claude Mythos Preview noong April 7.

Ginulat ng Claude Mythos Preview ng Anthropic ang AI world dahil ito na ang kauna-unahang AI model na nakumpleto ang buong simulated attack sa corporate network, ayon sa bagong evaluation ng UK AI Security Institute (AISI).

Ilang araw lang matapos i-announce ang model noong April 7, mabilis nang kumalat ang balita na malayo na talaga ang narating ng AI pagdating sa cyber attack capabilities — kaya dapat alerto ang mga security team sa buong mundo.

Ano ang Claude Mythos?

In-announce ng Anthropic ang Claude Mythos Preview model noong April 7, pero pinili nilang huwag agad i-release sa publiko. Imbes, limitado lang ang access ng mga security research firms para ma-assess at mapaghandaan ang advanced na kakayanan nito.

“Malakas talaga ang performance ng model na ito sa lahat ng aspeto — pero kakaiba ang galing niya sa tasks na may kinalaman sa computer security. Kaya nag-launch kami ng Project Glasswing, kung saan gagamitin ang Mythos Preview para tulungan ma-secure ang pinaka-critical na software ng mundo at maihanda ang buong tech industry sa mga bagong practices na kailangan natin para hindi maiwan ng mga cyberattacker,” sabi sa announcement.

I-follow kami sa X para sa pinaka-fresh na crypto at tech news

Agad umingay ang development at napag-usapan hindi lang sa tech world kundi pati na rin sa mga gumagawa ng policy. Ayon sa Reuters na may sources na familiar dito, nag-meeting agad sina US Treasury Secretary Scott Bessent at Federal Reserve Chair Jerome Powell kasama ang mga malalaking CEO ng bangko para magbabala tungkol sa cyber risks na pwedeng konektado sa Claude Mythos model.

Paano Nag-perform ang Claude Mythos Preview

Pinag-aralan ng AI Security Institute (AISI), isang research organization sa ilalim ng UK Department for Science, Innovation and Technology, ang Anthropic Claude Mythos Preview para matest ang cybersecurity capabilities nito gamit ang mga simulated na atake. Basahin dito kung paano ginagamit ang blockchain sa cyber attacks.

Unang ginawa ang “capture the flag” (CTF) evaluation, kung saan kailangang mahanap at ma-exploit ng model ang mga vulnerabilities para makuha ang nakatagong “flags.” Umabot ng 73% success rate si Mythos sa expert-level tasks — na hindi pa nagagawa ng kahit anong AI model bago mag-April 2025.

Claude Mythos Cyber Attack Capabilities. Pinapakita sa chart kung gaano kalakas ang Mythos model pagdating sa cyber attack tasks.
Claude Mythos Cyber Attack Capabilities. Source: AISI

Sinubukan din ng AISI ang 32-step na corporate network attack simulation na tinawag nilang “The Last Ones” (TLO). Aabutin ng mga human security pro ng hanggang 20 oras para matapos ito.

Sobrang lupit ni Mythos Preview dahil natapos niya ang buong simulation sa tatlo sa 10 beses na sinubukan. On average, nakakumpleto siya ng 22 sa 32 attack steps. Yung Claude Opus 4.6 naman, na sumunod lang sa galing, kalahati lang ng steps ang kayang tapusin — 16 steps lang on average.

“Yung nagawa ng Mythos Preview sa isang cyber range, ibig sabihin nito kaya na niyang mag-attack nang mag-isa sa mga enterprise system na mahina o vulnerable kapag nakapasok na siya sa network. Pero, syempre, may difference pa rin ang simulation sa totoong mundo kaya mas madali pa rin yung ginawa naming tests,” dagdag ng team.

Base naman sa sariling red team testing ng Anthropic, kaya ng Claude Mythos Preview hanapin at mag-exploit ng zero-day vulnerabilities sa lahat ng major operating systems at top web browsers — basta’t iinstruct ng user.

“May limitasyon kami sa pwede naming i-report dito. Nasa 99% ng vulnerabilities na nahahanap namin ay hindi pa na-papatch, kaya ‘di namin pwedeng ilabas pa ang details tungkol dito,” sabi rin ng team.

Nagbigay-payo naman ang AISI: dapat unahin ng mga organization ang basic cybersecurity, tulad ng regular patching, higpit sa access controls, i-audit at i-configure nang secure ang systems, at buo at malawak na logging ng activities.

Mag-subscribe sa YouTube channel namin para sa expert insights mula sa mga crypto leaders at journalists

Upang mabasa ang pinakabagong pagsusuri sa merkado ng cryptocurrency mula sa BeInCrypto, i-click dito.

Disclaimer

Alinsunod sa mga patakaran ng Trust Project, ang opinion article na ito ay nagpapahayag ng opinyon ng may-akda at maaaring hindi kumakatawan sa mga pananaw ng BeInCrypto. Nananatiling committed ang BeInCrypto sa transparent na pag-uulat at pagpapanatili ng pinakamataas na pamantayan ng journalism. Pinapayuhan ang mga mambabasa na i-verify ang impormasyon sa kanilang sariling kakayahan at kumonsulta sa isang propesyonal bago gumawa ng anumang desisyon base sa nilalamang ito. Paalala rin na ang aming Terms and Conditions, Privacy Policy, at Disclaimers ay na-update na.