Folosind o rețetă testată cu succes și la momentul lansării ChatGPT, Anthropic a propagat mai întâi mesaje alarmante despre cât de periculos poate fi AI-ul Claude Mythos dacă încape pe mâini greșite, doar pentru a-și ignora propriile avertismente anunțând disponibilitatea publică a mai multor modele AI din clasa Mythos.
Pentru cine nu a urmărit firul evenimentelor, Mythos a fost anunțat în aprilie ca un model AI testat în cerc restrâns, cu parteneri din sfera instituțiilor americane de informații și companii americane alese pe sprânceană, Anthropic anunțând cu maximă îngrijorare că a restricționat accesul și că amână pe termen nelimitat lansarea comercială a acestui produs.
Pe scurt, Claude Mythos este un AI special dezvoltat pentru a investiga și descoperi pe repede înainte vulnerabilități de securitate în aplicații software de tot felul. Însă așa cum au arătat și reprezentanții Mozilla, una dintre companiile invitate pentru testare în cerc restrâns, deși Claude Mythos acționează precum o armată de hackeri înarmată cu provizii nelimitate de băuturi energizante, puterea și capabilitățile sale sunt constrânse de experiența de hacking a exemplelor reale folosite pentru antrenarea modelului AI. Chiar dacă ar putea apărea și excepții, în general AI-ul Mythos nu poate descoperi bug-uri și vulnerabilități software pe care un hacker experimentat nu le-ar fi descoperit și pe cont propriu, dacă ar fi avut suficient timp la dispoziție.
Dar chiar și așa, Mythos poate fi cu ușurință clasificat drept un hazard/pericol major la adresa securității cibernetice la modul general, dacă orice „antreprenor” fără experiență de hacking dar cu fonduri suficiente pentru achiziționarea unei licențe achiziționează și pune la treabă unul dintre modelele AI puse la dispoziție de Anthropic.
”Avantajul va aparține părții care poate profita la maximum de aceste instrumente”, a avertizat Anthropic în aprilie, când a anunțat modelul Mythos.
„Pe termen scurt, aceștia ar putea fi atacatori, dacă laboratoarele de frontieră nu sunt atente la modul în care lansează aceste modele. Pe termen lung, ne așteptăm ca apărătorii să fie cei care vor direcționa mai eficient resursele și vor folosi aceste modele pentru a remedia erorile înainte de lansarea vreunui cod nou.”

Companiile de inteligență artificială evită de obicei să implementeze modele puternice până când nu dezvoltă bariere de protecție solide care să prevină utilizarea abuzivă. Dar cum procedezi când Mythos este în mod simultan sursa și soluția tuturor problemelor de securitate cibernetică imaginabile?
Deocamdată putem doar să credem pe cuvânt dezvoltatorul Anthropic care susține că a reușit să dezvolte bariere de protecție puternice pentru a preveni utilizarea abuzivă a modelului Mythos, despre care se crede că este mult mai puternic decât Opus 4.8 și alte modele disponibile pe internet.
Într-o postare pe blog , Anthropic a confirmat că intenționează să lanseze publicului modele din clasa Mythos în următoarele săptămâni, dar nu s-a angajat într-un interval de timp specific.
„Facem progrese rapide în dezvoltarea acestor măsuri de siguranță și ne așteptăm să putem oferi modele din clasa Mythos tuturor clienților noștri în următoarele săptămâni”.
Potrivit companiei, modelul Mythos prezintă îmbunătățiri majore în ceea ce privește raționamentul și autonomia codului, mult peste modelul emblematic actual al lui Claude, Opus 4.8.

