Il 29 marzo OpenAI ha presentato il software Voice Engine, che sfrutta l'intelligenza artificiale per creare voci basate su brevi registrazioni di appena 15 secondi ed è in grado di leggere il testo. Può riprodurre anche discorsi in lingue straniere, anche con registrazioni in cui è utilizzata solo la lingua inglese.
Voice Engine è stato sviluppato da OpenAI nel 2022 ed è stato testato con un gruppo di clienti alla fine del 2023. In questo contesto, il software ha dimostrato la capacità di supportare la lettura, tradurre contenuti tra diverse lingue e creare voci per persone che hanno perso la capacità di parlare.

Tuttavia, OpenAI ha anche sottolineato i potenziali rischi della tecnologia di imitazione della voce, soprattutto nel contesto delle elezioni presidenziali statunitensi. Questo è uno dei motivi per cui hanno deciso di limitare l'accesso e di non rendere questa tecnologia ampiamente disponibile.
Secondo la società proprietaria di ChatGPT, l'annuncio di Voice Engine mira a incoraggiare i manager e il pubblico ad aumentare la vigilanza contro le truffe che utilizzano l'intelligenza artificiale. Gli sviluppatori avvertono inoltre che i criminali potrebbero utilizzare software di impersonificazione vocale per rubare informazioni personali o hackerare i sistemi di sicurezza delle banche.
"È importante che le persone capiscano dove ci porterà questa tecnologia, indipendentemente dal fatto che la divulghiamo ampiamente o meno", ha affermato OpenAI.

La tecnologia di editing vocale basata sull'intelligenza artificiale ha attirato l'attenzione dopo che a gennaio è diventata virale sui social media una registrazione che imitava la voce del presidente degli Stati Uniti Joe Biden, il quale esortava le persone a "non partecipare alle primarie democratiche del New Hampshire".
Pindrop Security, un'azienda specializzata nel rilevamento di frodi vocali, ha poi analizzato la registrazione e ha concluso che si trattava di un deepfake che utilizzava la tecnologia di ElevenLabs, una startup che sviluppa software di intelligenza artificiale in grado di generare voci in più di 20 lingue.
Secondo la rivista Fortune, la voce deepfake del signor Biden ha suscitato preoccupazione tra molti esperti e funzionari elettorali statunitensi, che la definiscono "un tentativo di interferire con le elezioni tramite l'intelligenza artificiale". Alcune valutazioni dimostrano che non solo è facile distribuire deepfake audio, ma esiste anche il rischio che malintenzionati utilizzino questa tecnologia per influenzare i risultati delle elezioni e scoraggiare gli elettori dal recarsi alle urne.