Il settore in rapida crescita dell’intelligenza artificiale (IA) è noto per le sue prestazioni eccezionali, ma affronta una sfida significativa in termini di consumo energetico. Una nuova proposta, avanzata da due eminenti scienziati dell’Istituto Max Planck per la Scienza della Luce di Erlangen, in Germania, si propone di addestrare l’intelligenza artificiale in modo più efficiente, con il potenziale di rivoluzionare il modo in cui l’IA elabora i dati.
Attualmente, i modelli di IA consumano enormi quantità di energia durante il processo di addestramento. Anche se non esistono dati precisi, le stime di Statista suggeriscono che l’addestramento di GPT-3 richiede circa 1000 megawattora, equivalente al consumo energetico annuale di 200 famiglie tedesche di dimensioni considerevoli. Nonostante questo addestramento ad alta intensità energetica abbia portato a risultati notevoli nella generazione di sequenze di parole, c’è accordo sul fatto che non abbia realmente compreso i significati sottostanti delle frasi.
Mentre i sistemi di IA convenzionali si basano su reti neurali artificiali digitali, il futuro potrebbe risiedere nell’informatica neuromorfica. Florian Marquardt, direttore dell’Istituto Max Planck e professore all’Università di Erlangen, ha sottolineato le inefficienze delle configurazioni tradizionali di IA.
“La semplice trasmissione dei dati tra processore e memoria richiede una quantità significativa di energia”, ha evidenziato Marquardt, mettendo in luce le limitazioni nell’addestramento di vaste reti neurali.
Il calcolo neuromorfico si ispira al funzionamento del cervello umano, elaborando i dati in parallelo anziché in sequenza. Fondamentalmente, le sinapsi cerebrali fungono sia da processore che da memoria. Attualmente, stanno emergendo sistemi che cercano di emulare queste caratteristiche, come i circuiti fotonici che sfruttano la luce per effettuare calcoli.
Florian Marquardt e il dottorando Víctor López-Pastor hanno collaborato per sviluppare un innovativo metodo di addestramento per i computer neuromorfici. La loro “macchina fisica di autoapprendimento” ottimizza i suoi parametri in modo intrinseco attraverso un processo fisico, eliminando la necessità di un feedback esterno. “L’assenza di questa richiesta di feedback rende l’addestramento molto più efficiente”, ha sottolineato Marquardt, suggerendo che questo approccio potrebbe portare a risparmi significativi sia in termini di energia che di tempo di elaborazione.
Tuttavia, questa tecnica innovativa richiede specifiche condizioni. Il processo deve essere reversibile, garantendo una perdita minima di energia, e deve essere sufficientemente complesso o non lineare. “Solo i processi non lineari possono gestire le complesse trasformazioni tra dati in ingresso e risultati”, ha affermato Marquardt, facendo una distinzione tra azioni lineari e non lineari.
Le basi teoriche del loro approccio si traducono in applicazioni pratiche. In collaborazione con un team sperimentale, stanno sviluppando un computer neuromorfico ottico che elabora le informazioni utilizzando onde luminose sovrapposte. Il loro obiettivo è ambizioso: realizzare la prima macchina fisica di autoapprendimento entro tre anni. Queste future reti dovrebbero gestire quantità di dati maggiori e saranno addestrate su set di dati più ampi rispetto ai sistemi attuali. Date le crescenti esigenze nell’ambito dell’IA e le inefficienze delle configurazioni attuali, sembra inevitabile e promettente il passaggio a computer neuromorfici addestrati in modo più efficiente.
Come dichiara Marquardt: “Siamo fiduciosi che le macchine fisiche di autoapprendimento abbiano un ruolo solido nell’evoluzione continua dell’intelligenza artificiale”. Sia la comunità scientifica che gli appassionati di IA attendono con grande interesse quello che il futuro ha in serbo.