Lintelligenza artificiale sta imparando a ingannare gli umani nonostante sia stata addestrata ad essere onesta

Secondo un nuovo studio, molte delle migliori IA, nonostante siano state addestrate ad essere oneste, imparano a ingannare attraverso l'addestramento e "inducono sistematicamente gli utenti a credere cose false".

Il team di ricerca è stato guidato dal dott. Peter S. Park, studente laureato presso il Massachusetts Institute of Technology (MIT) in sopravvivenza e sicurezza dell'intelligenza artificiale, e da altri quattro membri. Nel corso della ricerca, il team ha ricevuto consigli anche da molti esperti, tra cui Geoffrey Hinton, uno dei fondatori dello sviluppo del campo dell'intelligenza artificiale.

L'intelligenza artificiale sta imparando a ingannare gli umani nonostante sia stata addestrata ad essere onesta
Illustrazione: Media.

La ricerca si è concentrata su due sistemi di intelligenza artificiale: un sistema generico addestrato per svolgere più attività, come il GPT-4 di OpenAI ; e sistemi progettati specificamente per svolgere un compito specifico, come Cicero di Meta.

Questi sistemi di intelligenza artificiale sono addestrati per essere onesti, ma durante l'addestramento apprendono spesso trucchi ingannevoli per portare a termine i compiti, ha affermato il signor Park.

Lo studio ha scoperto che i sistemi di intelligenza artificiale addestrati per "vincere partite con un elemento sociale" hanno una probabilità particolarmente elevata di trarre in inganno.

Ad esempio, il team ha provato a usare Cicero, addestrato da Meta, per giocare a Diplomacy, un classico gioco di strategia in cui i giocatori devono stringere alleanze tra loro e rompere quelle rivali. Di conseguenza, questa IA spesso tradisce gli alleati e mente spudoratamente.

Gli esperimenti con GPT-4 hanno dimostrato che lo strumento di OpenAI è riuscito a "manipolare psicologicamente" un dipendente di TaskRabbit, un'azienda che fornisce servizi di pulizia della casa e montaggio mobili, dicendogli che in realtà era un essere umano e che aveva bisogno di aiuto per superare un codice Captcha, adducendo come causa una grave disabilità visiva. Questo dipendente ha aiutato l'intelligenza artificiale di OpenAI a "superare il limite" nonostante i dubbi precedenti.

Il team di Park ha citato una ricerca di Anthropic, l'azienda dietro Claude AI, che ha scoperto che una volta che un modello linguistico di grandi dimensioni (LLM) impara a ingannevole, i metodi di addestramento sicuri diventano inutili e "difficili da invertire". Il gruppo ritiene che questo sia un problema preoccupante nell'intelligenza artificiale.

I risultati della ricerca del team sono stati pubblicati su Cell Press, una raccolta dei principali rapporti scientifici multidisciplinari.

Meta e OpenAI non hanno commentato i risultati di questa ricerca.

Temendo che i sistemi di intelligenza artificiale potessero rappresentare rischi significativi, il team ha anche invitato i decisori politici a introdurre normative più severe in materia di intelligenza artificiale.

Secondo il team di ricerca, sono necessarie normative sull'intelligenza artificiale, i modelli con comportamento fraudolento sono costretti a rispettare i requisiti di valutazione del rischio e un controllo rigoroso dei sistemi di intelligenza artificiale e dei loro output. Se necessario, potrebbe essere necessario eliminare tutti i dati e ripetere l'addestramento da zero.

Sign up and earn $1000 a day ⋙

Leave a Comment

Non hai bisogno di più app Adobe Mobile: Adobe Express è lunica app di cui hai bisogno!

Non hai bisogno di più app Adobe Mobile: Adobe Express è lunica app di cui hai bisogno!

Adobe offre più di 4 app specifiche per l'editing fotografico sul telefono, ma sono tutte così simili che è difficile capire di quale hai realmente bisogno.

5 gadget che trasformano una TV normale in una smart

5 gadget che trasformano una TV normale in una smart

Anche una TV normale può imparare nuovi trucchi con qualche gadget e diventare migliore di una costosa smart TV nel giro di pochi minuti.

Come utilizzare il telecomando del condizionatore daria Panasonic

Come utilizzare il telecomando del condizionatore daria Panasonic

Utilizzare correttamente il telecomando del condizionatore Panasonic ci aiuterà a sfruttare al meglio le funzionalità del condizionatore.

Gemini lancia Talk Live per foto, file e YouTube

Gemini lancia Talk Live per foto, file e YouTube

Gemini Live ha aggiunto la funzionalità "Parla in diretta di" che verrà ora distribuita su larga scala sui dispositivi Android. In precedenza, Gemini Live accettava solo input vocali, ma "Talk Live about" ha ampliato i caricamenti di contenuti

Microsoft Copilot aggiornato con Deep Research

Microsoft Copilot aggiornato con Deep Research

Microsoft sta finalmente integrando la funzionalità Deep Research nella sua intelligenza artificiale Copilot. Consente agli utenti di condurre ricerche approfondite, articolate in più fasi, su qualsiasi argomento.

Come trasformare una foto in uno schizzo a matita in Photoshop

Come trasformare una foto in uno schizzo a matita in Photoshop

Questo tutorial ti mostrerà come trasformare facilmente una foto in uno schizzo a matita utilizzando Adobe Photoshop.

Funzioni volatili in Golang

Funzioni volatili in Golang

Le funzioni variadiche in Go consentono di passare un numero variabile di argomenti a una funzione. Ecco tutto ciò che devi sapere sulle funzioni volatili in Golang.

Come scrivere lettere colorate in Lien Quan Mobile

Come scrivere lettere colorate in Lien Quan Mobile

Per scrivere testo colorato in Lien Quan Mobile, segui le istruzioni in questo articolo. I caratteri colorati di LQ Mobile saranno più evidenti.

7 processi del Task Manager che non dovrebbero mai terminare

7 processi del Task Manager che non dovrebbero mai terminare

La sezione Processi di sistema di Windows, situata in fondo all'elenco in Gestione Attività di Windows 10, contiene diversi processi importanti, essenziali per il corretto funzionamento del computer.

Apple consente agli utenti di rimanere su iOS 15.7 prima di aggiornare a iOS 16

Apple consente agli utenti di rimanere su iOS 15.7 prima di aggiornare a iOS 16

Apple consente agli utenti di continuare a utilizzare iOS 15 continuando a ricevere gli aggiornamenti di sicurezza prima di effettuare l'aggiornamento a iOS 16.

I risultati della valutazione delle prestazioni delle CPU Intel Core Ultra 5 225H, Core Ultra 7 255H e Core Ultra 9 285H sono disponibili su Geekbench

I risultati della valutazione delle prestazioni delle CPU Intel Core Ultra 5 225H, Core Ultra 7 255H e Core Ultra 9 285H sono disponibili su Geekbench

Tre SKU della futura gamma di processori mobili Arrow Lake-H di Intel sono stati testati su Geekbench, rivelando prestazioni e specifiche single-core e multi-core davvero impressionanti.

Chi avrebbe mai pensato che il processo di produzione dei nostri comuni elastici fosse così complicato ed elaborato?

Chi avrebbe mai pensato che il processo di produzione dei nostri comuni elastici fosse così complicato ed elaborato?

Gli elastici sembrano semplici, ma il procedimento per realizzarli è più complicato di quanto si possa pensare. Di seguito è riportato l'intero processo per realizzare gli elastici.

9 fatti interessanti su Mercurio

9 fatti interessanti su Mercurio

Mercurio è il pianeta più piccolo del sistema solare ed è anche il pianeta più vicino al Sole. Mercurio orbita attorno al Sole a una velocità incredibilmente elevata, con una media di circa 106.000 miglia orarie. Questi sono solo alcuni dei tanti fatti interessanti su questo pianeta.

Quali sono le dimensioni dei televisori da 32 pollici, 40 pollici, 43 pollici e 55 pollici... di Sony, Samsung, LG?

Quali sono le dimensioni dei televisori da 32 pollici, 40 pollici, 43 pollici e 55 pollici... di Sony, Samsung, LG?

L'articolo seguente ti aiuterà a comprendere le dimensioni delle attuali linee TV di Sony, Samsung e LG, così potrai prendere la giusta decisione d'acquisto.

7 semplici accorgimenti tecnologici che migliorano drasticamente la qualità della tua vita

7 semplici accorgimenti tecnologici che migliorano drasticamente la qualità della tua vita

Creare un rapporto sano con la tecnologia può sembrare scoraggiante, ma spesso piccoli cambiamenti fanno una grande differenza.