Un caso finito recentemente sulla stampa ha evidenziato come Claude 3.5 Sonnet, il modello di intelligenza artificiale sviluppato da Anthropic e generalmente noto per la sua affidabilità, possa essere aggirato per produrre contenuti razzisti e addirittura malware.
nuove minacce
Manipolazione emotiva: la tecnica che mette a nudo le vulnerabilità dei LLM
Nonostante la reputazione di modello AI sicuro, uno studente afferma che Claude 3.5 Sonnet può essere indotto a generare discorsi d’odio e malware attraverso tecniche di manipolazione emotiva. Ecco come funziona questa tecnica di “jailbreaking” e perché serve una chiamata all’azione per la sicurezza dell’AI
Esperto di AI Security, Consulente dell'Unione Europea

Continua a leggere questo articolo
Who's Who
Argomenti
Canali
SPAZIO CISO
-

Imaging di sicurezza: perché standardizzare i sistemi riduce rischi, costi e tempi
16 Giu 2026 -

Da alert fatigue a cyber resilience: come Novomatic ha trasformato il proprio SOC con HyperSOC
12 Giu 2026 -

L’importanza della discovery e dell’osservabilità nell’era agentica
11 Giu 2026 -

Aggiornamenti Microsoft giugno 2026: tre zero-day e il ritorno di Nightmare Eclipse
10 Giu 2026 -
![IT procurement]()
IT Procurement e sicurezza: come scegliere i vendor giusti
10 Giu 2026








