L’Apprendimento Profondo di oggi è come la magia – in tutte le vie sbagliate
Kalev Leetaru
Al centro di ogni magia c’è l’illusione. Dal più semplice trucco con le carte alla più grande produzione teatrale, la magia è al centro della creazione delle circostanze in cui il pubblico può sospendere l’incredulità e attribuire la propria immaginazione e i propri sogni agli eventi a cui stanno assistendo. La realtà fisica della magia è molto più banale, combinando una catena di montaggio di sviluppatori che creano nuovi trucchi e un concatenamento logistico e artistico di quei discreti trucchi in spettacoli complessi che diventano più della somma delle loro parti. In circostanze perfette, queste sequenze di trucchi si combinano per creare “magia”, ma possono rapidamente precipitare al minimo problema o se viste da qualcosa di diverso dall’angolo perfetto. Il mondo del deep learning condivide molto in comune.
Proprio come il mondo della magia, oggi l’apprendimento approfondito è in gran parte definito dai professionisti che sfornano un flusso costante di algoritmi limitati a un unico trucco che sono poi incatenati insieme in sequenze complesse dagli sviluppatori per risolvere i problemi. In perfette circostanze e alimentati con dati di input ideali che corrispondono ai dati di allenamento originali, le soluzioni risultanti sono a dir poco magiche, consentendo ai loro utenti di sospendere l’incredulità e immaginare per un momento che un silicio intelligente sia dietro i loro risultati. Eppure il minimo cambiamento di anche un singolo pixel può gettare tutto nel caos, con il risultato di risultati assolutamente privi di senso o addirittura minacciosi per la vita.
I limiti dell’apprendimento correlativo profondo di oggi indicano che gli algoritmi sono tipicamente focalizzati in modo estremamente ristretto, progettati per eseguire un singolo piccolo compito. Le soluzioni pratiche sono formate raggruppando questi algoritmi in pipeline, non in modo dissimile da come il codice è stato scritto dall’inizio del tempo.
La differenza è che mentre raggruppiamo questo codice insieme smettiamo di pensarlo come codice e algoritmi e antropomorfizziamo invece in un essere intelligente, sebbene primitivo, che “capisce” e “impara”.
A sua volta, questo modo di pensare ci porta ad essere meno cauti nel pensare ai limiti del nostro codice, supponendo inconsciamente che qualcuno “imparerà” ad aggirare quei limiti da solo senza che noi abbiamo bisogno di curare i suoi dati di addestramento o di modificarli algoritmi noi stessi.
Il pubblico non vede nessuno di questi limiti. Invece, vedono uno spettacolo di magia attentamente coreografato tenuto in perfette circostanze con dati di input ideali quasi identici ai suoi esempi di allenamento.
Mantenere questa illusione è il fatto che solo i successi dell’apprendimento profondo vengono pubblicizzati. La sua miriade di fallimenti non è mai vista dal pubblico.
Aziende come Facebook si rifiutano di riportare i tassi falsi positivi dei loro algoritmi di deep learning e si rifiutano fermamente di consentire qualsiasi forma di revisione esterna che possa gettare anche la minima luce sul modo in cui si esibiscono nella vita reale. Le statistiche scelte con cura pubblicate nei materiali di marketing e nelle relazioni pubbliche non offrono alcuna comprensione di come questi algoritmi si comportano nella pratica piuttosto che in circostanze ideali.
Il risultato finale è che, come un buon spettacolo di magia, il mondo dell’apprendimento approfondito che il pubblico vede è poco più che un’illusione gestita dal palcoscenico. Collezioni di trucchi semplicistici sono presentate in circostanze ideali al fine di convincere il pubblico di una rivoluzione dell’IA che esiste solo nella loro immaginazione.
Le aziende automobilistiche senza conducente vendono veicoli sull’idea che in pochi anni quelle macchine supereranno in modo autonomo i migliori conducenti umani, anche mentre quelle aziende riconoscono internamente che la tecnologia di oggi non può offrire un mondo del genere.
Compriamo liberamente in questa illusione di una rivoluzione AI, perché vogliamo credere che le macchine intelligenti che decenni di fantascienza hanno predetto siano finalmente arrivate.
Piuttosto che acquistare in questo spettacolo di magia, il pubblico dovrebbe chiedere di sbirciare dietro le quinte per vedere quanto siano pessimi gli algoritmi di deep learning di oggi. Man mano che gli algoritmi moderano sempre più il nostro discorso, decidiamo ciò che vediamo e influenziamo ogni cosa, dai nostri sistemi giudiziari, a chi può affittare l’appartamento, il pubblico dovrebbe avere il diritto di vedere la realtà dei trucchi da salotto economici dietro lo spettacolo magico. Forse se il pubblico comprendesse davvero quanto siano pessimi i sistemi di deep learning di oggi, le aziende potrebbero dover affrontare una maggiore pressione per migliorare i loro sistemi e circoscrivere i loro punti di fallimento.
Mettendo tutto insieme, proprio come un buon spettacolo di magia, lo stupore e il successo dei moderni sistemi di apprendimento profondo si basa su un’illusione gestita con cura e convincendo il pubblico ad attribuire la più selvaggia immaginazione delle intelligenze di silicio a mere banali di codice che fanno poco più di registrare semplici elenchi di correlazioni statistiche.
Alla fine, poiché i sistemi di apprendimento profondo modellano sempre più le nostre vite, il pubblico dovrebbe avere il diritto di ritrarre il sipario e vedere la realtà disordinata e non magica dietro il sipario che controlla sempre più il nostro mondo.