Lintelligenza artificiale sta imparando a ingannare gli umani nonostante sia stata addestrata ad essere onesta

Secondo un nuovo studio, molte delle migliori IA, nonostante siano state addestrate ad essere oneste, imparano a ingannare attraverso l'addestramento e "inducono sistematicamente gli utenti a credere cose false".

Il team di ricerca è stato guidato dal dott. Peter S. Park, studente laureato presso il Massachusetts Institute of Technology (MIT) in sopravvivenza e sicurezza dell'intelligenza artificiale, e da altri quattro membri. Nel corso della ricerca, il team ha ricevuto consigli anche da molti esperti, tra cui Geoffrey Hinton, uno dei fondatori dello sviluppo del campo dell'intelligenza artificiale.

L'intelligenza artificiale sta imparando a ingannare gli umani nonostante sia stata addestrata ad essere onesta
Illustrazione: Media.

La ricerca si è concentrata su due sistemi di intelligenza artificiale: un sistema generico addestrato per svolgere più attività, come il GPT-4 di OpenAI ; e sistemi progettati specificamente per svolgere un compito specifico, come Cicero di Meta.

Questi sistemi di intelligenza artificiale sono addestrati per essere onesti, ma durante l'addestramento apprendono spesso trucchi ingannevoli per portare a termine i compiti, ha affermato il signor Park.

Lo studio ha scoperto che i sistemi di intelligenza artificiale addestrati per "vincere partite con un elemento sociale" hanno una probabilità particolarmente elevata di trarre in inganno.

Ad esempio, il team ha provato a usare Cicero, addestrato da Meta, per giocare a Diplomacy, un classico gioco di strategia in cui i giocatori devono stringere alleanze tra loro e rompere quelle rivali. Di conseguenza, questa IA spesso tradisce gli alleati e mente spudoratamente.

Gli esperimenti con GPT-4 hanno dimostrato che lo strumento di OpenAI è riuscito a "manipolare psicologicamente" un dipendente di TaskRabbit, un'azienda che fornisce servizi di pulizia della casa e montaggio mobili, dicendogli che in realtà era un essere umano e che aveva bisogno di aiuto per superare un codice Captcha, adducendo come causa una grave disabilità visiva. Questo dipendente ha aiutato l'intelligenza artificiale di OpenAI a "superare il limite" nonostante i dubbi precedenti.

Il team di Park ha citato una ricerca di Anthropic, l'azienda dietro Claude AI, che ha scoperto che una volta che un modello linguistico di grandi dimensioni (LLM) impara a ingannevole, i metodi di addestramento sicuri diventano inutili e "difficili da invertire". Il gruppo ritiene che questo sia un problema preoccupante nell'intelligenza artificiale.

I risultati della ricerca del team sono stati pubblicati su Cell Press, una raccolta dei principali rapporti scientifici multidisciplinari.

Meta e OpenAI non hanno commentato i risultati di questa ricerca.

Temendo che i sistemi di intelligenza artificiale potessero rappresentare rischi significativi, il team ha anche invitato i decisori politici a introdurre normative più severe in materia di intelligenza artificiale.

Secondo il team di ricerca, sono necessarie normative sull'intelligenza artificiale, i modelli con comportamento fraudolento sono costretti a rispettare i requisiti di valutazione del rischio e un controllo rigoroso dei sistemi di intelligenza artificiale e dei loro output. Se necessario, potrebbe essere necessario eliminare tutti i dati e ripetere l'addestramento da zero.

Leave a Comment

Come risolvere lerrore di mancata invio della chat di Microsoft Teams

Come risolvere lerrore di mancata invio della chat di Microsoft Teams

Problemi con l'errore di chat di Microsoft Teams che non invia messaggi? Scopri le soluzioni dettagliate per gli ultimi problemi di Teams, dalla cancellazione della cache alle modifiche di rete. Torna a chattare senza problemi in pochi minuti!

Come risolvere lerrore hardware di Microsoft Teams (correzione del registro 2026)

Come risolvere lerrore hardware di Microsoft Teams (correzione del registro 2026)

Stanco di crash di Microsoft Teams con errori gravi? Ottieni la comprovata correzione del registro 2026 che risolve il problema in pochi minuti. Guida passo passo, screenshot e suggerimenti per una risoluzione definitiva. Funziona con le versioni più recenti!

Risoluzione dei problemi relativi al portachiavi di errore di Microsoft Teams per Mac

Risoluzione dei problemi relativi al portachiavi di errore di Microsoft Teams per Mac

Hai problemi con il portachiavi di errore di Microsoft Teams su Mac? Scopri soluzioni comprovate e dettagliate per macOS per tornare a collaborare senza problemi. Soluzioni rapide all'interno!

Come risolvere lerrore La scheda Wiki di Microsoft Teams non si carica

Come risolvere lerrore La scheda Wiki di Microsoft Teams non si carica

Hai problemi con il caricamento della scheda Wiki di Microsoft Teams? Scopri soluzioni passo passo comprovate per risolvere rapidamente il problema, ripristinare le schede Wiki e aumentare la produttività del team senza problemi.

Come risolvere i problemi di audio ovattato o assente del microfono di Microsoft Teams

Come risolvere i problemi di audio ovattato o assente del microfono di Microsoft Teams

Stanco di sentire l'audio ovattato o assente nel microfono di Microsoft Teams? Scopri come risolvere i problemi del microfono di Microsoft Teams con passaggi rapidi e comprovati. Un audio nitido ti aspetta!

Come correggere gli errori di sincronizzazione della gestione delle attività di Microsoft Teams

Come correggere gli errori di sincronizzazione della gestione delle attività di Microsoft Teams

Stanco degli errori di sincronizzazione di Gestione Attività di Microsoft Teams che interrompono il tuo flusso di lavoro? Segui le nostre soluzioni dettagliate e dettagliate per ripristinare la perfetta sincronizzazione delle attività tra Teams, Planner e To Do. Soluzioni rapide per un sollievo immediato!

Come cancellare la cache di Microsoft Teams per risolvere i problemi di prestazioni

Come cancellare la cache di Microsoft Teams per risolvere i problemi di prestazioni

Hai problemi con la lentezza di Microsoft Teams? Scopri come svuotare la cache di Microsoft Teams passo dopo passo per risolvere problemi di prestazioni, ritardi, arresti anomali e aumentare la velocità su Windows, Mac, web e dispositivi mobili. Soluzioni rapide e efficaci!

Risoluzione degli errori di rete di Microsoft Teams su Wi-Fi pubblico

Risoluzione degli errori di rete di Microsoft Teams su Wi-Fi pubblico

Problemi di rete di Microsoft Teams su una rete Wi-Fi pubblica? Ottieni soluzioni immediate come modifiche alla VPN, controlli delle porte e cancellazione della cache per ripristinare chiamate e riunioni senza problemi. Guida passo passo per un rapido sollievo.

Dove trovare il tuo ID Microsoft Teams e le informazioni sullaccount

Dove trovare il tuo ID Microsoft Teams e le informazioni sullaccount

Hai difficoltà a trovare il tuo ID Microsoft Teams o i dettagli del tuo account? Questa guida dettagliata mostra esattamente dove trovare il tuo ID Microsoft Teams e le informazioni del tuo account su desktop, web, dispositivi mobili e altro ancora, per una collaborazione senza interruzioni.

Come risolvere lerrore 1200 di Microsoft Teams sul telefono (iOS/Android)

Come risolvere lerrore 1200 di Microsoft Teams sul telefono (iOS/Android)

Stanco dell'errore 1200 di Microsoft Teams che blocca le tue chiamate al telefono? Scopri soluzioni rapide e dettagliate per iOS e Android per tornare a lavorare in team senza intoppi, senza bisogno di competenze tecniche!

Dove trovare la cartella di installazione di Microsoft Teams sul tuo PC

Dove trovare la cartella di installazione di Microsoft Teams sul tuo PC

Hai difficoltà a trovare la cartella di installazione di Microsoft Teams sul tuo PC? Questa guida dettagliata ti mostrerà i percorsi esatti per le installazioni di Teams, sia nuove che classiche, per utente e per computer. Risparmia tempo nella risoluzione dei problemi!

Come creare e gestire un bot in Microsoft Teams (2026)

Come creare e gestire un bot in Microsoft Teams (2026)

Scopri come creare e gestire un bot in Microsoft Teams (2026) con questa guida esperta. Dalla configurazione alla gestione avanzata, aumenta la produttività utilizzando gli ultimi strumenti di Bot Framework e Azure.

Perché la mia registrazione su Microsoft Teams non è riuscita? Motivi comuni

Perché la mia registrazione su Microsoft Teams non è riuscita? Motivi comuni

Frustrato perché la tua registrazione su Microsoft Teams non è riuscita? Scopri le cause più comuni, come problemi di autorizzazioni, limiti di spazio di archiviazione e problemi di rete, oltre a soluzioni dettagliate per prevenire futuri errori e registrare in modo impeccabile ogni volta.

Come risolvere lerrore di accesso a Microsoft Teams sui Chromebook

Come risolvere lerrore di accesso a Microsoft Teams sui Chromebook

Problemi di accesso a Microsoft Teams su Chromebook? Scopri le soluzioni dettagliate per risolvere rapidamente i problemi di accesso. Svuota la cache, aggiorna le app e altro ancora per un lavoro di squadra senza intoppi. Compatibile con l'ultima versione di Chrome OS!

Come mantenere Microsoft Teams attivo e disponibile tutto il giorno

Come mantenere Microsoft Teams attivo e disponibile tutto il giorno

Scopri come mantenere Microsoft Teams attivo e disponibile tutto il giorno. Suggerimenti, strumenti e impostazioni comprovati per evitare lo stato "Assente", aumentare la produttività e non perdere mai un colpo durante la tua giornata lavorativa.