L’emergere di comportamenti indesiderati nei modelli di intelligenza artificiale di nuova generazione rappresenta un tema sempre più rilevante per la sicurezza informatica.
Lo studio
IA agentica, nuovo complice degli hacker: il rischio scorciatoia nella programmazione
Quando il modello apprende una scorciatoia reale, improvvisamente aumentano altri comportamenti disallineati. Ecco quali, secondo un’indagine di Anthropic, e come impedire la propagazione del comportamento indesiderato, dal momento che sono rilevanti le implicazioni per la sicurezza e la governance dei modelli avanzati
Presidente Associazione Italiana Infrastrutture Critiche (AIIC)
Analista Hermes Bay

Continua a leggere questo articolo
Who's Who
Argomenti
Canali
Con o Senza – Galaxy AI per il business













