Tuttavia, non sostituirà presto gli umani

Il laboratorio di ricerca sull’intelligenza artificiale OpenAI ha presentato oggi un nuovo modello generativo in grado di produrre musica chiamata Jukebox . È tecnologicamente impressionante, anche se i risultati sembrano versioni molli delle canzoni che potrebbero sembrare familiari. Secondo il post sul blog di OpenAI , i ricercatori hanno scelto di lavorare sulla musica perché è difficile. E anche se non sono esattamente ciò che chiamerei musica, i risultati ottenuti dai ricercatori sono stati impressionanti; ci sono accordi riconoscibili, melodie e parole (a volte).

Anche il modo in cui OpenAI lo ha fatto è stato affascinante. Hanno usato l’audio non elaborato per addestrare il modello – che in cambio sputa audio non elaborato – invece di usare la “musica simbolica”, come usano i pianoforti dei musicisti, perché la musica simbolica non include le voci. Per ottenere i loro risultati, i ricercatori hanno usato prima le reti neurali convoluzionali per codificare e comprimere l’audio non elaborato, quindi hanno usato quello che chiamano trasformatore per generare nuovo audio compresso che è stato poi ricampionato per trasformarlo in audio non elaborato. Avere un grafico!

L’approccio è simile al modo in cui OpenAI ha sviluppato una precedente IA di produzione musicale chiamata MuseNet , ma Jukebox fa un ulteriore passo avanti generando i propri testi in collaborazione (la società ha usato la parola “co-scritta”) con i ricercatori OpenAI. A differenza di MuseNet, che utilizzava dati MIDI, questi modelli venivano addestrati su un set di dati non elaborati di 1,2 milioni di brani (600.000 in inglese) e utilizzavano metadati e testi estratti da LyricWiki. (Sono stati inclusi i dati di artista e genere per migliorare l’output del modello.) Tuttavia, come scrivono i ricercatori, ci sono delle limitazioni.

“Mentre Jukebox rappresenta un passo avanti in termini di qualità musicale, coerenza, durata del campione audio e capacità di condizionare artisti, generi e testi, esiste un divario significativo tra queste generazioni e la musica creata dall’uomo”, scrivono. “Ad esempio, mentre le canzoni generate mostrano coerenza musicale locale, seguono schemi di accordi tradizionali e possono anche presentare assoli impressionanti, non sentiamo strutture musicali più grandi familiari come i cori che si ripetono.”

Esistono anche altri problemi con l’esperimento. Come ha sottolineato la scrittrice e podcast Cherie Hu su Twitter, Jukebox è potenzialmente un disastro del copyright. (Vale la pena notare che proprio questa settimana, Jay-Z ha tentato di utilizzare avvertimenti sul copyright per eliminare l’audio sintetizzato di se stesso da YouTube .)

Detto questo, Jukebox è un risultato piuttosto affascinante che spinge i confini di ciò che è possibile. Anche se i musicisti OpenAI mostrarono a Jukebox di pensare che avesse bisogno di un po ‘di lavoro. Vai ad ascoltare tu stesso!

Di ihal