OpenAI annuncia Voice Engine: la rivoluzionaria tecnologia per la clonazione della voce

Entra nel nuovo canale WhatsApp di NextMe.it
Voice Engine

OpenAI ha recentemente fatto parlare di sé con l’ufficializzazione di Voice Engine, un innovativo strumento progettato per clonare le voci umane, secondo quanto rivelato in un post sul loro blog datato 29 marzo 2024. In questa occasione, è stata sottolineata l’importanza di un approccio etico: l’accesso al tool non è infatti al momento disponibile al grande pubblico, precludendo così la possibilità di un suo utilizzo in ambiti discutibili, come la creazione di deepfake.

La premura di OpenAI per l’etica è evidente nella cautela con cui procede verso la distribuzione di Voice Engine. Nonostante non sia stata ancora comunicata una data di rilascio definitiva, il team guidato da Sam Altman è attivamente impegnato nel definire strategie per prevenire possibili abusi del sistema. Ciò nonostante, l’annuncio ha già suscitato un ampio dibattito, considerando che Voice Engine rappresenta un passo avanti nelle capacità di sintesi vocale offerte da OpenAI, con l’ambizioso obiettivo di replicare una voce umana a partire da soli 15 secondi di registrazione audio, garantendo al contempo che il campione audio fornito venga eliminato immediatamente dopo l’elaborazione.

Una nuova feature in OpenAI

L’implementazione di Voice Engine amplia significativamente le funzionalità vocali già esistenti nei servizi OpenAI, inclusi quelli di ChatGPT per la lettura ad alta voce. Interessante è l’esempio di Spotify che ha utilizzato questa tecnologia per doppiare in varie lingue podcast noti, come quello di Lex Fridman, dimostrando così le potenzialità di questa innovazione. Il processo di addestramento del modello si basa su una combinazione di dati pubblici e licenziati, senza però includere l’audio fornito dagli utenti, che viene eliminato post-elaborazione per rispettare la privacy.

Jeff Harris, membro del Product Staff di OpenAI, ha espresso il desiderio dell’azienda di garantire che l’uso di questa tecnologia sia percepito positivamente dal pubblico, sottolineando l’importanza di comprendere i potenziali rischi e di avere strategie di mitigazione pronte. Sebbene la clonazione vocale non sia una novità assoluta nel panorama tecnologico, con aziende come Replica Studios che operano in questo settore, il progetto di OpenAI si distingue per le sue implicazioni e le promesse di un’offerta potenzialmente competitiva, nonostante i dettagli sul prezzo non siano ancora stati divulgati.