OpenAI presenta Jukebox, un nuovo modello AI di intelligenza artificiale che genera musica specifica per genere con i testi

Tuttavia, non sostituirà presto gli umani

Il laboratorio di ricerca sull’intelligenza artificiale OpenAI ha presentato oggi un nuovo modello generativo in grado di produrre musica chiamata Jukebox . È tecnologicamente impressionante, anche se i risultati sembrano versioni molli delle canzoni che potrebbero sembrare familiari. Secondo il post sul blog di OpenAI , i ricercatori hanno scelto di lavorare sulla musica perché è difficile. E anche se non sono esattamente ciò che chiamerei musica, i risultati ottenuti dai ricercatori sono stati impressionanti; ci sono accordi riconoscibili, melodie e parole (a volte).

Anche il modo in cui OpenAI lo ha fatto è stato affascinante. Hanno usato l’audio non elaborato per addestrare il modello – che in cambio sputa audio non elaborato – invece di usare la “musica simbolica”, come usano i pianoforti dei musicisti, perché la musica simbolica non include le voci. Per ottenere i loro risultati, i ricercatori hanno usato prima le reti neurali convoluzionali per codificare e comprimere l’audio non elaborato, quindi hanno usato quello che chiamano trasformatore per generare nuovo audio compresso che è stato poi ricampionato per trasformarlo in audio non elaborato. Avere un grafico!

L’approccio è simile al modo in cui OpenAI ha sviluppato una precedente IA di produzione musicale chiamata MuseNet , ma Jukebox fa un ulteriore passo avanti generando i propri testi in collaborazione (la società ha usato la parola “co-scritta”) con i ricercatori OpenAI. A differenza di MuseNet, che utilizzava dati MIDI, questi modelli venivano addestrati su un set di dati non elaborati di 1,2 milioni di brani (600.000 in inglese) e utilizzavano metadati e testi estratti da LyricWiki. (Sono stati inclusi i dati di artista e genere per migliorare l’output del modello.) Tuttavia, come scrivono i ricercatori, ci sono delle limitazioni.

“Mentre Jukebox rappresenta un passo avanti in termini di qualità musicale, coerenza, durata del campione audio e capacità di condizionare artisti, generi e testi, esiste un divario significativo tra queste generazioni e la musica creata dall’uomo”, scrivono. “Ad esempio, mentre le canzoni generate mostrano coerenza musicale locale, seguono schemi di accordi tradizionali e possono anche presentare assoli impressionanti, non sentiamo strutture musicali più grandi familiari come i cori che si ripetono.”

Esistono anche altri problemi con l’esperimento. Come ha sottolineato la scrittrice e podcast Cherie Hu su Twitter, Jukebox è potenzialmente un disastro del copyright. (Vale la pena notare che proprio questa settimana, Jay-Z ha tentato di utilizzare avvertimenti sul copyright per eliminare l’audio sintetizzato di se stesso da YouTube .)

Detto questo, Jukebox è un risultato piuttosto affascinante che spinge i confini di ciò che è possibile. Anche se i musicisti OpenAI mostrarono a Jukebox di pensare che avesse bisogno di un po ‘di lavoro. Vai ad ascoltare tu stesso!

OpenAI presenta Jukebox, un nuovo modello AI di intelligenza artificiale che genera musica specifica per genere con i testi

Diihal

Di ihal

Articoli correlati

Baidu rivoluziona il suo motore di ricerca con l’AI Search Paradigm

TeamViewer Intelligence, l’AI per il supporto IT aziendale

FileAI lancia la piattaforma V2, AI per l’automazione dei flussi di lavoro aziendali

You missed

OpenAI smentisce ogni legame con i token criptovalutari emessi da Robinhood: un avvertimento agli investitori

Baidu rivoluziona il suo motore di ricerca con l’AI Search Paradigm

Lovable, la startup svedese di vibe coding, conquista l’Europa con una crescita esplosiva e una valutazione di 1,8 miliardi di dollari

KT annuncia il rilascio open source del modello linguistico avanzato Believe:um 2.0