Anthropic Apre il Framework di Rilevamento Vulnerabilità Alimentato da AI
Un Nuovo Blueprint Open-Source per la Sicurezza AI
Anthropic ha compiuto un passo significativo verso la democratizzazione della sicurezza alimentata da AI rilasciando il suo "Defending Code Reference Harness" su GitHub. Questo framework open-source fornisce un'implementazione di riferimento per la scoperta e la correzione autonoma delle vulnerabilità utilizzando Claude, offrendo ai team di sicurezza un blueprint per costruire le proprie pipeline di scansione.
Il rilascio coincide con una significativa espansione dell'iniziativa Project Glasswing di Anthropic. L'azienda sta aggiungendo circa 150 nuovi partner selezionati in 15 paesi al programma, che concede l'accesso al potente modello Claude Mythos Preview. Ciò segue una coorte iniziale di circa 50 organizzazioni annunciate all'inizio di aprile.
Questo approccio a doppio binario - open-sourcing degli strumenti fondamentali mentre si espande l'accesso controllato a modelli all'avanguardia - riflette la strategia di Anthropic per accelerare l'adozione dell'AI nella sicurezza informatica gestendo al contempo i rischi associati. Il framework si basa sulle lezioni apprese dalle partnership con i team di sicurezza sin dal lancio di Mythos.
Dentro il Reference Harness
Il repository GitHub fornisce sia abilità interattive che una pipeline autonoma progettate per aiutare i team di sicurezza a implementare flussi di lavoro di rilevamento delle vulnerabilità assistiti da AI. Il framework include diversi componenti chiave che riflettono i processi di sicurezza professionali.
Le abilità interattive sono progettate per Claude Code e includono:
/threat-model: Per costruire modelli di minaccia di sicurezza/vuln-scan: Per eseguire scansioni di vulnerabilità statiche/triage: Per verificare, deduplicare e classificare i risultati/patch: Per generare e convalidare correzioni/customize: Per adattare la pipeline a diversi codebase
Queste abilità operano in modalità lettura/scrittura solo e sono sicure da eseguire senza sandboxing quando utilizzate in modo interattivo con Claude Code. La pipeline autonoma, tuttavia, esegue il codice bersaglio e richiede sandboxing tramite container gVisor con egress limitato all'API Claude.
L'Architettura della Pipeline
La pipeline di riferimento autonoma segue un sofisticato flusso di lavoro a sette stadi che dimostra l'approccio di Anthropic alla sicurezza testata da AI. L'attuale implementazione si concentra sulla ricerca di vulnerabilità di memoria in C/C++ utilizzando Docker e ASAN (AddressSanitizer).
Gli stadi della pipeline includono:
- Build: Compila il bersaglio in un'immagine Docker con ASAN
- Recon: Identifica sottosistemi di parsing degli input distinti per un'esplorazione mirata
- Find: Gli agenti paralleli creano input malformati per attivare crash
- Verify: Gli agenti di valutazione separati riproducono crash in container freschi
- Dedupe: Gli agenti giudici confrontano i risultati con bug noti
- Report: Crea analisi di sfruttabilità strutturate
- Patch: Genera e convalida correzioni proposte
Anthropic sottolinea che questa è un'implementazione di riferimento, non un prodotto, e richiede personalizzazione per diversi linguaggi, classi di vulnerabilità e metodi di rilevamento. L'azienda fornisce una guida per il porting della pipeline ad altri stack rispondendo a domande chiave sui processi di build, formati proof-of-concept e segnali di rilevamento.
L'Impatto in Espansione di Project Glasswing
Dal suo lancio all'inizio di aprile, i primi 50 partner di Project Glasswing hanno utilizzato Claude Mythos per scoprire più di 10.000 vulnerabilità di alta o critica gravità in quello che Anthropic descrive come "alcuni dei software più importanti sistemicamente al mondo".
La nuova espansione include fornitori di infrastrutture essenziali, manutentori di software open-source critici e tester di sicurezza con sede sia negli Stati Uniti che all'estero. Il processo di verifica di Anthropic assicura che i partner soddisfino rigorosi requisiti di sicurezza prima di accedere a Mythos.
Il post sul blog dell'azienda osserva che "per la maggior parte dei partner, stimiamo che un attacco importante potrebbe colpire più di 100 milioni di persone, con importanti ripercussioni sia per la sicurezza globale che nazionale". Ciò evidenzia l'importanza strategica delle organizzazioni che ora ottengono l'accesso a queste capacità.
La Sfida della Verifica
Mentre i modelli AI accelerano drasticamente la scoperta delle vulnerabilità, creano nuovi colli di bottiglia nel flusso di lavoro di sicurezza. I test propri di Anthropic rivelano la portata di questa sfida: Mythos ha scansionato più di 1.000 progetti open-source, segnalando 23.019 potenziali vulnerabilità con 6.202 stimate come alte o critiche.
Di 1.752 risultati classificati come alti o critici che hanno subito una revisione indipendente, oltre il 90% sono stati confermati come validi. Questo alto tasso di convalida sottolinea l'efficacia di Mythos ma evidenzia anche l'onere della verifica.
Anthropic riconosce questo cambiamento fondamentale, affermando nel loro post sul blog: "Il collo di bottiglia nel correggere bug come questi è la capacità umana di classificare, segnalare e progettare e distribuire patch per essi". Questa ammissione si allinea con le preoccupazioni sollevate dalle organizzazioni di sicurezza riguardo ai difensori sopraffatti dagli attacchi accelerati dall'AI.
Panorama Competitivo e Implicazioni di Mercato
Le mosse di Anthropic avvengono in un contesto di crescente competizione nello spazio della sicurezza AI. OpenAI ha offerto a nove importanti banche del Regno Unito l'accesso al suo strumento di sicurezza AI, GPT-5.5 Cyber, secondo fonti citate nell'articolo di CSOonline.
Questa pressione competitiva sta guidando un'innovazione rapida ma sta anche sollevando preoccupazioni sull'asimmetria creata da modelli di sicurezza ad alta capacità concentrati nelle mani di poche organizzazioni selezionate. Come nota l'analisi editoriale di Let's Data Science, "L'asimmetria creata da un piccolo gruppo di attori che eseguono modelli di sicurezza ad alta capacità... rende la governance, i controlli di accesso e la divulgazione coordinata delle vulnerabilità preoccupazioni primarie".
Anthropic ha affrontato alcune di queste preoccupazioni rilasciando Claude Security, un prodotto che utilizza il suo modello Claude Opus 4.8 pubblicamente disponibile che è stato utilizzato per correggere più di 2.100 vulnerabilità in tre settimane. Ciò fornisce un'opzione più accessibile per le organizzazioni non nel programma Glasswing.
Guida all'Implementazione Pratica
Anthropic fornisce un piano di rampa di quattro passaggi basato sulle lezioni apprese dalle implementazioni di team di sicurezza di successo:
Passaggio 1 (Giorno 1): I team sono incoraggiati a costruire un modello di minaccia ed eseguire la loro prima scansione statica e classificazione utilizzando le abilità interattive. Ciò stabilisce il flusso di lavoro di base senza richiedere sandboxing.
Passaggio 2 (Giorno 2): I team di sicurezza eseguono la pipeline autonoma su una libreria C/C++ nota per essere vulnerabile per comprendere il ciclo completo di ricognizione → ricerca → verifica → report in azione.
Passaggio 3 (Giorni 3-5): Le organizzazioni personalizzano la pipeline per i loro obiettivi specifici rispondendo a domande chiave sul loro stack tecnologico, segnali di vulnerabilità e formati proof-of-concept.
Passaggio 4 (Settimana 2): I team implementano la scansione autonoma su larga scala, aggiungendo un ciclo esterno per gestire i risultati attraverso più esecuzioni della pipeline, dare priorità alla classificazione e coordinare la correzione.
Considerazioni sulla Sicurezza e la Governance
Anthropic ha implementato salvaguardie significative nel suo framework di riferimento. La pipeline autonoma richiede sandboxing gVisor e rifiuta di eseguire al di fuori di esso a meno che non sia esplicitamente sovrascritto. Gli agenti eseguono in container isolati con egress limitato all'API Claude.
L'azienda ha anche dichiarato che non rilascerà modelli di classe Mythos al pubblico generale, citando l'assenza di sufficienti salvaguardie per prevenire un uso improprio grave. Questo approccio cauto riflette le preoccupazioni sulla natura duale dell'uso di potenti strumenti di rilevamento delle vulnerabilità.
Come nota l'articolo di CyberScoop, un rapporto congiunto della Cloud Security Alliance, del SANS Institute e di OWASP ha concluso che le organizzazioni sono "probabilmente destinate a essere sopraffatte" nel breve termine dagli attori della minaccia che utilizzano l'AI per trovare e sfruttare le vulnerabilità più velocemente di quanto i difensori possano correggerle.
Il Futuro della Sicurezza Alimentata da AI
Il rilascio del framework di Anthropic e l'espansione di Glasswing rappresentano un momento cruciale nell'evoluzione della sicurezza informatica. L'azienda descrive questo come "il passo successivo verso i nostri obiettivi a lungo termine: affinché l'AI renda tutto il software più sicuro e affinché noi aiutiamo l'industria ad adattarsi a come l'AI potrebbe cambiare molte delle ipotesi fondamentali della sicurezza informatica".
Le implementazioni di successo che seguono il piano di rampa tendono a evolversi in diverse direzioni: revisione dei repository interni e delle dipendenze per priorità, costruzione di infrastrutture di scansione, incorporazione delle scansioni nei processi SDLC e creazione di programmi di scansione ricorrenti.
La natura open-source del reference harness consente ai team di sicurezza di adattare questi approcci alle loro esigenze specifiche mentre Anthropic continua a sviluppare capacità più avanzate attraverso il suo programma Glasswing. Questo approccio bilanciato - che combina l'accessibilità aperta con l'accesso controllato alla tecnologia all'avanguardia - potrebbe definire come l'AI trasformerà il rilevamento e la correzione delle vulnerabilità negli anni a venire.
Related News

Le guardie di sicurezza AI di Anthropic Fable scatenano la reazione negativa dei ricercatori

Corte tedesca stabilisce che Google è responsabile degli errori nelle panoramiche AI

Apple annuncia macOS Golden Gate e macchine container Linux

Apple presenta l'architettura AI basata sui modelli di base di Google Gemini

Xiaomi MiMo raggiunge 1000 TPS con il modello 1T, ridefinendo la velocità dell'AI

