Home / Servizi AI / OpenAI presenta Jukebox, un nuovo modello AI di intelligenza artificiale che genera musica specifica per genere con i testi

OpenAI presenta Jukebox, un nuovo modello AI di intelligenza artificiale che genera musica specifica per genere con i testi


Tuttavia, non sostituirà presto gli umani

Il laboratorio di ricerca sull’intelligenza artificiale OpenAI ha presentato oggi un nuovo modello generativo in grado di produrre musica chiamata Jukebox . È tecnologicamente impressionante, anche se i risultati sembrano versioni molli delle canzoni che potrebbero sembrare familiari. Secondo il post sul blog di OpenAI , i ricercatori hanno scelto di lavorare sulla musica perché è difficile. E anche se non sono esattamente ciò che chiamerei musica, i risultati ottenuti dai ricercatori sono stati impressionanti; ci sono accordi riconoscibili, melodie e parole (a volte).

Anche il modo in cui OpenAI lo ha fatto è stato affascinante. Hanno usato l’audio non elaborato per addestrare il modello – che in cambio sputa audio non elaborato – invece di usare la “musica simbolica”, come usano i pianoforti dei musicisti, perché la musica simbolica non include le voci. Per ottenere i loro risultati, i ricercatori hanno usato prima le reti neurali convoluzionali per codificare e comprimere l’audio non elaborato, quindi hanno usato quello che chiamano trasformatore per generare nuovo audio compresso che è stato poi ricampionato per trasformarlo in audio non elaborato. Avere un grafico!

L’approccio è simile al modo in cui OpenAI ha sviluppato una precedente IA di produzione musicale chiamata MuseNet , ma Jukebox fa un ulteriore passo avanti generando i propri testi in collaborazione (la società ha usato la parola “co-scritta”) con i ricercatori OpenAI. A differenza di MuseNet, che utilizzava dati MIDI, questi modelli venivano addestrati su un set di dati non elaborati di 1,2 milioni di brani (600.000 in inglese) e utilizzavano metadati e testi estratti da LyricWiki. (Sono stati inclusi i dati di artista e genere per migliorare l’output del modello.) Tuttavia, come scrivono i ricercatori, ci sono delle limitazioni.

“Mentre Jukebox rappresenta un passo avanti in termini di qualità musicale, coerenza, durata del campione audio e capacità di condizionare artisti, generi e testi, esiste un divario significativo tra queste generazioni e la musica creata dall’uomo”, scrivono. “Ad esempio, mentre le canzoni generate mostrano coerenza musicale locale, seguono schemi di accordi tradizionali e possono anche presentare assoli impressionanti, non sentiamo strutture musicali più grandi familiari come i cori che si ripetono.”

Esistono anche altri problemi con l’esperimento. Come ha sottolineato la scrittrice e podcast Cherie Hu su Twitter, Jukebox è potenzialmente un disastro del copyright. (Vale la pena notare che proprio questa settimana, Jay-Z ha tentato di utilizzare avvertimenti sul copyright per eliminare l’audio sintetizzato di se stesso da YouTube .)

Detto questo, Jukebox è un risultato piuttosto affascinante che spinge i confini di ciò che è possibile. Anche se i musicisti OpenAI mostrarono a Jukebox di pensare che avesse bisogno di un po ‘di lavoro. Vai ad ascoltare tu stesso!

Top

Utilizzando il sito, accetti l'utilizzo dei cookie da parte nostra. maggiori informazioni

Questo sito utilizza i cookie per fornire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o cliccando su "Accetta" permetti il loro utilizzo.

Chiudi