Il deep learning sta colmando il divario tra il mondo digitale e quello reale

Gli algoritmi sono sempre stati di casa nel mondo digitale , dove vengono addestrati e sviluppati in ambienti perfettamente simulati. L’attuale ondata di deep learning facilita il passaggio dell’IA dal mondo digitale a quello fisico. Le applicazioni sono infinite, dalla produzione all’agricoltura, ma ci sono ancora ostacoli da superare.

Per gli specialisti dell’IA tradizionale, il deep learning (DL) è vecchio. Ha avuto la sua svolta nel 2012 quando Alex Krizhevsky ha implementato con successo le reti neurali convoluzionali, il segno distintivo della tecnologia di deep learning, per la prima volta con il suo algoritmo AlexNet. Sono le reti neurali che hanno permesso ai computer di vedere, ascoltare e parlare. DL è il motivo per cui possiamo parlare con i nostri telefoni e dettare e-mail ai nostri computer. Eppure gli algoritmi DL hanno sempre svolto la loro parte nell’ambiente simulato sicuro del mondo digitale. I ricercatori Pioneer AI stanno lavorando duramente per introdurre il deep learning nel nostro mondo fisico e tridimensionale. Già, il mondo reale .

Il deep learning potrebbe fare molto per migliorare la tua attività, che tu sia un produttore di automobili, un produttore di chip o un agricoltore. Sebbene la tecnologia sia maturata, il passaggio dal mondo digitale a quello fisico si è rivelato più impegnativo di quanto molti si aspettassero. Questo è il motivo per cui sono anni che parliamo di frigoriferi intelligenti che fanno la nostra spesa, ma in realtà nessuno ne ha ancora uno. Quando gli algoritmi lasciano i loro comodi nidi digitali e devono cavarsela da soli in tre dimensioni molto reali e grezze, c’è più di una sfida da superare.

Annotazione automatizzata
Il primo problema è la precisione. Nel mondo digitale, gli algoritmi possono farla franca con una precisione di circa l’80%. Questo non lo taglia del tutto nel mondo reale. “Se un robot per la raccolta dei pomodori vede solo l’80% di tutti i pomodori, il coltivatore perderà il 20% del suo fatturato”, afferma Albert van Breemen, un ricercatore olandese di intelligenza artificiale che ha sviluppato algoritmi DL per l’agricoltura e l’orticoltura nei Paesi Bassi. Le sue soluzioni di intelligenza artificiale includono un robot che taglia le foglie delle piante di cetriolo, un robot per la raccolta degli asparagi e un modello che prevede i raccolti di fragole. La sua azienda è attiva anche nel mondo della produzione medica, dove il suo team ha creato un modello che ottimizza la produzione di isotopi medici. “I miei clienti sono abituati a una precisione del 99,9% e si aspettano che l’IA faccia lo stesso”, afferma Van Breemen. “Ogni percentuale di perdita di precisione gli costerà denaro.”
Per raggiungere i livelli desiderati, i modelli AIdevono essere continuamente riqualificati, il che richiede un flusso di dati costantemente aggiornato. La raccolta dei dati è sia costosa che dispendiosa in termini di tempo, poiché tutti quei dati devono essere annotati dagli esseri umani. Per risolvere questa sfida, Van Breemen ha dotato ciascuno dei suoi robot di funzionalità che gli consentono di sapere quando sta funzionando bene o male. Quando commettono errori, i robot caricheranno solo i dati specifici in cui devono migliorare. Tali dati vengono raccolti automaticamente nell’intera flotta di robot. Quindi, invece di ricevere migliaia di immagini, il team di Van Breemen ne riceve solo un centinaio, che vengono quindi etichettate e contrassegnate e rispedite ai robot per la riqualificazione. “Alcuni anni fa tutti dicevano che i dati sono oro”, dice. “Ora vediamo che i dati sono in realtà un enorme pagliaio che nasconde una pepita d’oro. Quindi la sfida non è solo raccogliere molti dati,

Il suo team ha sviluppato un software che automatizza la riqualificazione di nuove esperienze. I loro modelli di intelligenza artificiale ora possono addestrarsi per nuovi ambienti da soli, tagliando efficacemente l’umano dal circuito. Hanno anche trovato un modo per automatizzare il processo di annotazione addestrando un modello di intelligenza artificiale a svolgere gran parte del lavoro di annotazione per loro. Van Breemen: “È alquanto paradossale perché si potrebbe obiettare che un modello in grado di annotare le foto è lo stesso modello di cui ho bisogno per la mia applicazione. Ma formiamo il nostro modello di annotazione con una dimensione dei dati molto più piccola rispetto al nostro modello obiettivo. Il modello di annotazione è meno accurato e può comunque commettere errori, ma è abbastanza buono per creare nuovi punti dati che possiamo utilizzare per automatizzare il processo di annotazione”.

Lo specialista olandese di intelligenza artificiale vede un enorme potenziale per il deep learning nel settore manifatturiero, dove l’IA potrebbe essere utilizzata per applicazioni come il rilevamento dei difetti e l’ottimizzazione delle macchine. L’industria globale della produzione intelligente è attualmente valutata a 198 miliardi di dollari e ha un tasso di crescita previsto dell’11% fino al 2025. La regione di Brainport intorno alla città di Eindhoven, dove ha sede l’azienda di Van Breemen, pullula di aziende manifatturiere di livello mondiale, come Philips e ASML. (Van Breemen ha lavorato per entrambe le società in passato.)

Il divario tra simulazione e realtà
Una seconda sfida dell’applicazione dell’IA nel mondo reale è il fatto che gli ambienti fisici sono molto più vari e complessi di quelli digitali. Un’auto a guida autonoma addestrata negli Stati Uniti non funzionerà automaticamente in Europa con le sue diverse regole e segnali stradali. Van Breemen ha affrontato questa sfida quando ha dovuto applicare il suo modello DL che taglia le foglie delle piante di cetriolo in una serra di un altro coltivatore. “Se ciò avvenisse nel mondo digitale, prenderei lo stesso modello e lo addestrerei con i dati del nuovo coltivatore”, afferma. “Ma questo particolare coltivatore gestiva la sua serra con illuminazione a LED, che dava a tutte le immagini del cetriolo un bagliore viola-bluastro che il nostro modello non riconosceva. Quindi abbiamo dovuto adattare il modello per correggere questa deviazione del mondo reale.
Van Breemen chiama questo il “divario tra simulazione reale”, la disparità tra un ambiente simulato prevedibile e immutabile e la realtà fisica imprevedibile e in continua evoluzione. Andrew Ng, il famoso ricercatore di intelligenza artificiale di Stanford e cofondatore di Google Brain che cerca anche di applicare il deep learning alla produzione, parla di “prova del concetto per il divario di produzione”. È uno dei motivi per cui il 75% di tutti i progetti di intelligenza artificiale nel settore manifatturiero non viene avviato. Secondo Ng, prestare maggiore attenzione alla pulizia del set di dati è un modo per risolvere il problema. La visione tradizionale dell’IA era quella di concentrarsi sulla creazione di un buon modello e lasciare che il modello gestisse il rumore nei dati. Tuttavia, nella produzione, una vista incentrata sui dati può essere più utile, poiché le dimensioni del set di dati sono spesso ridotte.

Oltre a dati più puliti, un altro modo per colmare il divario tra simulazione e realtà è utilizzare cycleGAN, una tecnica di traduzione di immagini che collega due domini diversi, resa popolare da app obsolete come FaceApp. Il team di Van Breemen ha studiato cycleGAN per la sua applicazione negli ambienti di produzione. Il team ha addestrato un modello che ha ottimizzato i movimenti di un braccio robotico in un ambiente simulato, in cui tre telecamere simulate hanno osservato un braccio robotico simulato che raccoglieva un oggetto simulato. Hanno quindi sviluppato un algoritmo DL basato su cycleGAN che ha tradotto le immagini dal mondo reale (tre telecamere reali che osservano un braccio robotico reale che raccoglie un oggetto reale) in un’immagine simulata, che potrebbe quindi essere utilizzata per riqualificare il modello simulato. Van Breemen: “Un braccio robotico ha molte parti mobili. Normalmente dovresti programmare tutti quei movimenti in anticipo. Ma se gli dai un obiettivo chiaramente descritto, come raccogliere un oggetto, ora ottimizzerà prima i movimenti nel mondo simulato. Attraverso cycleGAN puoi quindi utilizzare quell’ottimizzazione nel mondo reale, risparmiando molte ore di lavoro”. Ogni fabbrica separata che utilizza lo stesso modello di intelligenza artificiale per azionare un braccio robotico dovrebbe addestrare il proprio cicloGAN per modificare il modello generico per adattarlo ai propri parametri specifici del mondo reale.

Insegnamento rafforzativo
Il campo del deep learning continua a crescere e svilupparsi. La sua nuova frontiera si chiama apprendimento per rinforzo. È qui che gli algoritmi cambiano da semplici osservatori a decisori, fornendo ai robot istruzioni su come lavorare in modo più efficiente. Gli algoritmi DL standard sono programmati dagli ingegneri del software per eseguire un’attività specifica, come spostare un braccio robotico per piegare una scatola. Un algoritmo di rinforzo potrebbe scoprire che esistono modi più efficienti per piegare le scatole al di fuori del loro intervallo preprogrammato.

È stato l’apprendimento per rinforzo (RL) a far battere un sistema di intelligenza artificiale al miglior giocatore Go del mondo nel 2016. Ora anche RL si sta lentamente facendo strada nella produzione. La tecnologia non è ancora abbastanza matura per essere implementata, ma secondo gli esperti sarà solo questione di tempo.

Con l’aiuto di RL, Albert Van Breemen prevede di ottimizzare un’intera serra. Questo viene fatto lasciando che il sistema di intelligenza artificiale decida come le piante possono crescere nel modo più efficiente per il coltivatore per massimizzare i profitti. Il processo di ottimizzazione avviene in un ambiente simulato, dove vengono sperimentati migliaia di possibili scenari di crescita. La simulazione gioca con diverse variabili di crescita come temperatura, umidità, illuminazione e fertilizzante, quindi sceglie lo scenario in cui le piante crescono meglio. Lo scenario vincente viene poi ricondotto nel mondo tridimensionale di una vera serra. “Il collo di bottiglia è il divario tra simulazione e realtà”, spiega Van Breemen. “Ma mi aspetto davvero che questi problemi vengano risolti nei prossimi cinque o dieci anni”.

In qualità di psicologo qualificato, sono affascinato dalla transizione che l’IA sta effettuando dal mondo digitale a quello fisico. Mostra quanto sia davvero complesso il nostro mondo tridimensionale e quanta abilità neurologica e meccanica sia necessaria per azioni semplici come tagliare foglie o piegare scatole. Questa transizione ci sta rendendo più consapevoli dei nostri “algoritmi” interni gestiti dal cervello che ci aiutano a navigare nel mondo e che hanno impiegato millenni per svilupparsi. Sarà interessante vedere come l’IA competerà con questo. E se l’IA alla fine raggiungerà, sono sicuro che il mio frigorifero intelligente ordinerà champagne per festeggiare.

Il deep learning sta colmando il divario tra il mondo digitale e quello reale

Diihal

Di ihal

Articoli correlati

Vimar e l’Università di Padova presentano il Progetto Twist: l’AI nel processo di stampaggio a iniezione

Newability: Guida Autonoma basata su Deep Learning

Apprendimento automatico e data curation secondo ricercatori di Meta e Google

You missed

Il rinascimento digitale del Kung Fu: come la Cina riporta in vita i classici con l’AI

Grok arriva sulle Tesla: l’intelligenza artificiale di Elon Musk si integra nelle auto

Lavawave lancia SCAM GUARD, AI per contrastare i crimini digitali

Google Gemini introduce la funzione di generazione video da foto con Veo 3