Far funzionare l’IA con piccoli dati
È un vero dilemma manifatturiero: “insegnare” l’IA quando i difetti sono una rarità.
Mentre i produttori iniziano a integrare le soluzioni di intelligenza artificiale nelle linee di produzione, la scarsità di dati è emersa come una grande sfida. A differenza delle società Internet di consumo, che dispongono di dati provenienti da miliardi di utenti per addestrare potenti modelli di intelligenza artificiale, spesso non è possibile raccogliere enormi set di formazione nella produzione.
Ad esempio, nella produzione automobilistica, dove le pratiche Six Sigma snelle sono state ampiamente adottate, la maggior parte degli OEM e dei fornitori di livello 1 si sforzano di avere meno di 3-4 difetti per milione di parti. La rarità di questi difetti rende difficile disporre di dati sui difetti sufficienti per addestrare i modelli di ispezione visiva.
In un recente sondaggio MAPI , il 58% degli intervistati della ricerca ha riferito che la barriera più significativa all’implementazione di soluzioni di intelligenza artificiale riguardava la mancanza di risorse di dati.
Tecnologie per aggirare il problema dei piccoli dati
I big data hanno abilitato l’IA nelle società Internet di consumo. La produzione può anche far funzionare l’IA con piccoli dati? In effetti, i recenti progressi nell’intelligenza artificiale lo stanno rendendo possibile. I produttori possono utilizzare le seguenti tecniche e tecnologie per aggirare il problema dei piccoli dati per aiutare i loro progetti di intelligenza artificiale a diventare realtà anche con solo dozzine o meno esempi:
La generazione di dati sintetici viene utilizzata per sintetizzare nuove immagini che sono difficili da raccogliere nella vita reale. A tale scopo, è possibile utilizzare recenti progressi in tecniche come GAN, autoencoders variazionali, randomizzazione del dominio e aumento dei dati.
Il trasferimento dell’apprendimento è una tecnica che consente all’intelligenza artificiale di apprendere da un’attività correlata in cui sono disponibili ampi dati e quindi utilizza questa conoscenza per aiutare a risolvere l’attività di piccoli dati. Ad esempio, un’intelligenza artificiale impara a trovare ammaccature da 1.000 immagini di ammaccature raccolte da una varietà di prodotti e fonti di dati. Può quindi trasferire queste conoscenze per rilevare ammaccature in un prodotto specifico romanzo con solo alcune immagini di ammaccature.
Apprendimento autogestito : simile all’apprendimento del trasferimento. ma la conoscenza ottenuta viene acquisita risolvendo un compito leggermente diverso e quindi adattata al problema dei piccoli dati. Ad esempio, puoi prendere molte immagini OK e creare una griglia simile a un puzzle da ordinare in base a un modello base. La risoluzione di questo problema fittizio costringerà il modello ad acquisire conoscenze di dominio che possono essere utilizzate come punto di partenza nell’attività di piccoli dati.
Nell’apprendimento di pochi scatti, il problema dei piccoli dati viene riformulato per aiutare il sistema di intelligenza artificiale a imparare un compito di ispezione più facile e meno affamato di dati, raggiungendo lo stesso obiettivo. In questo scenario, AI ha migliaia di attività di ispezione più semplici, in cui ogni attività ha solo 10 (o un altro numero altrettanto piccolo) di esempi. Ciò costringe l’IA a imparare a individuare i modelli più importanti poiché ha solo un piccolo set di dati. Dopodiché, quando esponi questa IA al problema che ti interessa, che ha solo un numero simile di esempi, le sue prestazioni trarranno vantaggio dal fatto di aver visto migliaia di attività simili per piccoli dati.
L’apprendimento a colpo singolo è un caso speciale di apprendimento a colpo singolo in cui il numero di esempi per classe da cui deve imparare è uno invece di pochi (come nell’esempio sopra).
Nel rilevamento delle anomalie, l’IA vede zero esempi di difetti e solo esempi di immagini OK. L’algoritmo impara a contrassegnare qualsiasi potenziale che si discosti significativamente dalle immagini OK come potenziale problema.
Le conoscenze codificate a mano sono un esempio in cui un team di intelligenza artificiale intervista gli ingegneri ispettori e cerca di codificare il più possibile delle loro conoscenze istituzionali in un sistema. Il moderno machine learning tende a sistemi che si basano sui dati piuttosto che sulla conoscenza istituzionale umana, ma quando i dati non sono disponibili, team di IA qualificati possono progettare sistemi di machine learning che sfruttano questa conoscenza.
Human-in-the-the-loop descrive situazioni in cui una delle tecniche sopra elencate può essere utilizzata per costruire un sistema di errore iniziale, forse un po ‘più elevato. Ma l’IA è abbastanza intelligente da sapere quando è fiduciosa in un’etichetta o meno e sa mostrarla a un esperto umano e rimandare al proprio giudizio in quest’ultimo caso. Ogni volta che lo fa, impara anche dall’essere umano, in modo da aumentare l’accuratezza e la fiducia nel suo output nel tempo.
Utilizzando una combinazione di questi approcci, i produttori possono costruire e distribuire modelli efficaci di ispezione visiva formati su appena 10 esempi. Costruire sistemi con piccoli dati è importante per suddividere milioni di casi d’uso in cui sono disponibili solo piccoli set di dati. Per i produttori, ciò riduce al minimo il tempo, lo sforzo ingegneristico e i dati necessari per diventare operativi e creare valore pratico dall’intelligenza artificiale.