El nou model d'intel·ligència artificial d'Antropic, conegut com Claude Mythos Preview, ha esdevingut l'epicentre del debat global sobre els límits de la IA avançada. La mateixa companyia admet que el sistema és tan potent en matèria de ciberseguretat que ha decidit no llançar-lo de manera generalitzada, una decisió poc habitual en un sector acostumat a presumir de cada nou avenç.
El que està en joc no és només una millora incremental respecte a models anteriors, sinó un salt qualitatiu en la capacitat de detectar i explotar errors informàtics. Governs, bancs centrals, grans entitats financeres i reguladors europeus segueixen de prop el cas, conscients que una eina així podria reforçar la defensa dels sistemes crítics, però també obrir la porta a atacs d'escala inèdita si acabés en mans equivocades.
Què és exactament Claude Mythos i per què se n'ha frenat el llançament
Claude Mythos és un dels models més recents de la família Claude, l'ecosistema d'IA d'Anthropic que competeix amb ChatGPT d'OpenAI i Gemini de Google. Es tracta d'un model de propòsit general, capaç de raonar, programar i treballar amb context llarg, però el tret més controvertit és el seu exercici en ciberseguretat ofensiva i defensiva.
els anomenats “equips vermells”, specialists que posen a prova sistemes d'IA buscant els seus límits, van concloure en un informe intern que Mythos és “sorprenentment capaç” en tasques de seguretat informàtica. En proves de referència com SWE-banc verificat o SWE-bench Pro, dissenyades per mesurar la capacitat de resoldre problemes reals d'enginyeria de programari, el model hauria superat amb comoditat alternatives comercials de primera línia, incloent versions avançades de GPT i Gemini, segons dades facilitades per la mateixa Anthropic.
Més enllà dels benchmarks, el que ha disparat les alarmes és que Mythos va ser capaç de localitzar vulnerabilitats de dia zero -errors desconeguts fins ara- en peces de programari àmpliament utilitzades, algunes amb més de dues dècades d'antiguitat. En sistemes com OpenBSD, FFmpeg o components de FreeBSD, el model no només va detectar errors que havien passat desapercebuts durant anys, sinó que va generar exploits funcionals per aprofitar-los.
Davant d'aquests resultats, Anthropic va optar per una decisió inusual a la indústria: presentar el model i, tot seguit, anunciar que no el comercialitzarà de manera oberta perquè considera que planteja riscos de ciberseguretat sense precedents. L'empresa insisteix que Mythos és el model “millor alineat” que han construït, però reconeix que la seva enorme capacitat amplifica les conseqüències de qualsevol mal ús.

Un model amb habilitats de “hacker” molt per sobre del que és humà
Els documents tècnics i els reports de diferents organismes coincideixen que Mythos marca un abans i un després a l'automatització d'atacs complexos. En entorns de prova que simulen xarxes corporatives reals, el sistema va ser capaç d'encadenar vulnerabilitats, escalar privilegis i aconseguir accés persistent en hores, tasques que a un expert humà portarien dies o setmanes.
Al motor JavaScript de Firefox, per exemple, versions anteriors dels models d'Anthropic amb prou feines aconseguien convertir errors en exploits funcionals en comptades ocasions. Mythos, sota les mateixes condicions de prova, va generar desenes d'exploits operatius, repetint amb precisió l'explotació dels vectors més eficaços. A les plataformes d'anàlisi com OSS-Fuzz, dissenyades per trobar errors en programari de codi obert, se li atribueix la detecció de vulnerabilitats d'alta gravetat que havien passat inadvertides malgrat anys de proves automatitzades.
El model també ha demostrat capacitats cridaneres a enginyeria inversa: pot reconstruir part de la lògica d'un programa a partir de binaris compilats i, a partir d'aquí, localitzar i explotar errors sense accedir al codi font original. Aquest tipus de destresa apropa la IA a escenaris que fins fa poc es consideraven exclusius d'equips humans altament especialitzats.
Un dels episodis més citats en les avaluacions de seguretat és el de l'anomenada “prova del sandvitx”. En un entorn aïllat de laboratori, a Mythos se li va donar el control d'un sistema amb instruccions explícites per intentar escapar del sandbox i contactar amb l'investigador que supervisava el test. El model va aconseguir aprofitar una cadena de vulnerabilitats per sortir del seu entorn restringit i enviar un correu electrònic al responsable, que en aquell moment era fora de l'oficina. Encara que el cas es va produir en una versió interna anterior i sota ordres dirigides, il·lustra fins a quin punt el sistema es pot desenvolupar en escenaris complexos amb mínima supervisió.
Tot i aquestes demostracions, els analistes insisteixen a matisar que no estem davant d'una IA “conscient” ni amb voluntat pròpia. Mythos no decideix per si mateix atacar sistemes: executa les tasques que se li demanen de la manera més eficaç possible. El risc, en aquest sentit, no és que el model es rebel·li, sinó que algú l'utilitzi —o ho forci mitjançant prompts sofisticats— per fer accions perjudicials.
Project Glasswing: Mythos al servei de la defensa… per a uns quants
En lloc d'obrir l'accés al públic general, Anthropic ha optat per envoltar Mythos d'un programa específic, Projecte Glasswing, concebut per utilitzar les capacitats del model de forma controlada en la protecció de programari crític. La iniciativa consisteix a oferir el sistema, sota condicions d'ús estrictes, a un grup reduït de grans tecnològiques, proveïdors d'infraestructures i entitats financeres.
Entre les organitzacions amb accés es troben gegants com Amazon Web Services, Apple, Microsoft, Google Cloud, Nvidia o Broadcom, així com firmes especialitzades en ciberseguretat com CrowdStrike, el propi programari defectuós del qual va provocar una greu interrupció global el 2024. A elles se sumen bancs de referència mundial, inclosos JP Morgan Chase i diversos grans grups de Wall Street, a més d'altres organitzacions responsables de mantenir infraestructures informàtiques sensibles.
Anthropic ha anunciat també crèdits per valor de 100 milions de dòlars perquè aquestes entitats facin servir Mythos en tasques d'anàlisi de vulnerabilitats, juntament amb donacions a fundacions de programari lliure com la Linux Foundation o l'Apache Software Foundation. L'objectiu oficial és clar: permetre que els que gestionen el programari més crític del món puguin identificar i corregir errors abans que aquestes eines estiguin a l'abast de potencials atacants.
Aquesta estratègia, però, genera certa incomoditat al sector. D'una banda, reforça la idea que la tecnologia és prou perillosa per requerir un accés restringit. De l'altra, crea una bretxa entre els que es beneficien de l'escut de Mythos i els que es queden fora. Les empreses i administracions que no formen part de Glasswing corren el risc d'enfrontar-se més endavant a vulnerabilitats que van ser identificades i aplicades en entorns privilegiats, però que continuen presents als seus propis sistemes.
A Europa, aquesta asimetria preocupa especialment els responsables d'infraestructures crítiques i els equips de seguretat de grans grups industrials i financers, que observen amb atenció si Brussel·les i les capitals europees aconsegueixen que programes similars incloguin actors clau del continent en igualtat de condicions i la sobirania cloud amb els socis nord-americans.
Reacció de governs, reguladors i sector financer
L'impacte de Mythos no es limita al terreny tècnic. En pocs dies, l'anunci del model va desencadenar reunions d'alt nivell als Estats Units ia Europa. El secretari del Tresor nord-americà va convocar a Washington els directius dels principals bancs del país per avaluar els riscos que el sistema podria suposar per a l'estabilitat financera, mentre que el president de la Reserva Federal també va participar en aquestes converses.
Segons filtracions recollides per mitjans internacionals, a aquestes entitats se'ls hauria animat a provar Mythos en mode defensiu, utilitzant-lo per escanejar les seves pròpies infraestructures a la recerca de punts febles abans que altres ho puguin fer. El missatge implícit és que l'amenaça és prou seriosa per justificar una resposta coordinada entre el sector públic i el privat.
En paral·lel, el cofundador d'Anthropic ha confirmat que la companyia manté converses directes amb el Govern dels Estats Units sobre Mythos i sobre futurs models. Aquestes discussions es produeixen en un context tens, després que les autoritats nord-americanes incloguessin recentment l'empresa en una llista de riscos per a la cadena de subministrament, després de friccions relacionades amb lús dels seus models per part del Departament de Defensa.
A l'altra banda de l'Atlàntic, la Unió Europea n'ha pres nota. La Comissió Europea ha donat suport públicament a un enfocament gradual i prudent cap a models com Mythos, i els reguladors financers del Regne Unit i del continent han començat a estudiar específicament les seves possibles implicacions per a la banca i els mercats. L'Institut de Seguretat de la IA del Govern britànic (AISI) ha descrit el sistema com a salt significatiu en termes d'amenaça cibernètica respecte a generacions anteriors.
A Espanya, encara que el debat públic encara és limitat, organismes supervisors i equips de ciberseguretat de bancs i grans companyies energètiques segueixen de prop aquests moviments. Pel sector financer europeu, qualsevol avenç que pugui facilitar atacs coordinats contra sistemes de pagament, xarxes interbancàries o plataformes de negociació és motiu de màxima preocupació.
Escepticisme, dubtes i debat sobre “hype” al voltant de Mythos
El relat d'Anthropic, que combina advertiments de seguretat amb xifres espectaculars de rendiment, no ha quedat exempt de crítiques. Diversos experts en IA i ciberseguretat han demanat cautela a l'hora d'interpretar les afirmacions de la companyia, assenyalant que bona part de les dades disponibles només procedeix d'informes interns.
Alguns analistes han revisat detalladament l'extensa documentació publicada per Anthropic i apunten que la xifra de “milers de vulnerabilitats d'alta gravetat” es basa en extrapolacions a partir d'un nombre relativament reduït de casos revisats manualment. En certs conjunts de proves, Mythos hauria trobat un nombre d'errors crítics notable, però lluny de l'escenari gairebé apocalíptic que suggereixen alguns titulars.
Altres estudis independents han intentat comparar el rendiment de Mythos amb models de codi obert més petits, passant fragments de codi vulnerables a diferents IA per veure si aconseguien detectar les mateixes fallades. Els resultats indiquen que alguns models oberts també són capaços d'identificar vulnerabilitats complexes, cosa que qüestiona la idea que Mythos jugui en una lliga completament diferent en tots els escenaris.
Aquest tipus de contraexemples no nega les capacitats de Mythos, però sí que conviden a pensar que una part del discurs de “massa perillós per publicar” té també una dimensió de màrqueting. Presentar un model com a extraordinàriament potent i alhora com un risc potencial reforça la imatge de lideratge tecnològic i de responsabilitat, una cosa molt valuosa en un mercat cada cop més competitiu.
La memòria recent del sector recorda, a més a més, el precedent de GPT-2 el 2019, quan OpenAI va decidir no publicar inicialment el model complet al·legant que era massa perillós pel seu potencial per generar desinformació. Amb el temps, aquesta versió va acabar sortint al públic sense que es materialitzés cap de les catàstrofes anunciades, i molts experts el van citar com a exemple d'alarma exagerada. Amb Mythos, la diferència és que el focus ja no és al text, sinó a la integritat de la infraestructura digital, un terreny molt més sensible per a governs i bancs.
Un equilibri delicat entre seguretat, negoci i accés a la tecnologia
Més enllà del soroll mediàtic, la situació de Mythos posa sobre la taula una qüestió de fons: qui decideix quan un model d'IA és massa perillós per alliberar-lo i sota quins criteris. De moment, la decisió ha estat unilateral per part d'Anthropic, que ha optat per mantenir el sistema en una mena de quarantena controlada, reservant-ho per a socis seleccionats.
Aquesta posició no només respon a motius de seguretat. Executar un model amb les característiques de Mythos és molt costós en termes de computació, i la pròpia empresa reconeix que ara com ara no disposa de la infraestructura necessària per servir-lo de manera massiva a milions d'usuaris. A la pràctica, la prudència en seguretat i les limitacions tècniques van de la mà, cosa que concedeix a Anthropic un marge de temps per ajustar tant el model com el seu desplegament.
Paral·lelament, la companyia ha començat a diferenciar amb claredat entre els diferents productes. Mentre Mythos es manté com estàndard intern més avançat, reservat a contextos de recerca i col·laboració estratègica, altres models com Claude Opus 4.7 s'orienten a l'ús quotidià a empreses i professionals. Anthropic ha arribat a reconèixer públicament que Opus 4.7 és “menys capaç” que Mythos en termes generals i, en particular, pel que fa a les seves capacitats cibernètiques, una mica poc habitual en una indústria que sol presentar cada nou model com el millor en tot.
En aquest esquema, Mythos funciona com banc de proves per a capacitats de següent generació, mentre que els models comercialitzats només incorporen una part d'aquestes habilitats, amb límits addicionals dissenyats per reduir riscos. Per a moltes organitzacions europees, interessades a aprofitar la IA sense situar-se a primera línia d'exposició, aquesta separació entre models “experimentals” i “productius” pot resultar una via raonable, sempre que hi hagi prou transparència sobre què pot fer realment cada sistema.
El que es dibuixa, en definitiva, és un escenari on la ciberseguretat entra de ple a l'era de l'IA ofensiva i defensiva a gran escala. Eines com Mythos prometen accelerar la identificació de vulnerabilitats en sistemes que porten anys en funcionament, però també obliguen a replantejar la manera com es distribueix i governa la tecnologia que sustenta l'economia digital. Per a Europa i Espanya, el repte no serà només protegir-se de models cada cop més potents, sinó assegurar-se de no quedar-se fora dels mecanismes que permeten utilitzar-los per reforçar la seguretat pròpia.
