L’Università di Paderborn guida un progetto di ricerca dell’UE sull’intelligenza artificiale spiegabile
L’intelligenza artificiale (AI) è diventata parte integrante della nostra vita. Ha dato origine a assistenti intelligenti che svolgono compiti che altrimenti richiederebbero molto tempo e fatica agli esseri umani, ad esempio in medicina, affari e industria. Per fare ciò, gli assistenti intelligenti richiedono grandi quantità di dati. I “grafi della conoscenza” sono uno dei meccanismi preferiti per rappresentare i dati in questo caso, perché possono essere compresi sia dagli esseri umani che dalle macchine e assicurano che le informazioni vengano elaborate in modo logico. Sono considerati fondamentali per una serie di tecnologie popolari come i motori di ricerca Internet e gli assistenti digitali personali. Tuttavia, gli attuali approcci di apprendimento automatico per i grafi della conoscenza presentano ancora alcune carenze, in particolare per quanto riguarda la scalabilità, la coerenza e la completezza. Un ulteriore problema è che non soddisfano il bisogno umano di comprensibilità. I ricercatori dell’Università di Paderborn stanno ora lavorando a un progetto di ricerca su larga scala per sviluppare un apprendimento automatico spiegabile per grafici della conoscenza su larga scala. Al progetto ENEXA* partecipano anche il Centro nazionale per la ricerca scientifica “Demokritos” in Grecia, il Centro satellitare dell’Unione europea (SatCen) in Spagna, l’Università di Amsterdam nei Paesi Bassi e le società DATEV e webLyzard technology. La ricerca è finanziata per un periodo di tre anni per un importo di circa 4 milioni di euro nell’ambito del programma Horizon Europe dell’UE. Al progetto ENEXA* partecipano anche il Centro nazionale per la ricerca scientifica “Demokritos” in Grecia, il Centro satellitare dell’Unione europea (SatCen) in Spagna, l’Università di Amsterdam nei Paesi Bassi e le società DATEV e webLyzard technology. La ricerca è finanziata per un periodo di tre anni per un importo di circa 4 milioni di euro nell’ambito del programma Horizon Europe dell’UE. Al progetto ENEXA* partecipano anche il Centro nazionale per la ricerca scientifica “Demokritos” in Grecia, il Centro satellitare dell’Unione europea (SatCen) in Spagna, l’Università di Amsterdam nei Paesi Bassi e le società DATEV e webLyzard technology. La ricerca è finanziata per un periodo di tre anni per un importo di circa 4 milioni di euro nell’ambito del programma Horizon Europe dell’UE.
Spiegabilità dell’intelligenza artificiale
“Gli attuali approcci di spiegazione basati sull’apprendimento automatico sono spesso basati su un processo una tantum in cui l’intelligenza artificiale non tiene conto del fatto che l’essere umano che riceve la spiegazione abbia davvero compreso ciò che viene spiegato”, afferma il professor Axel-Cyrille Ngonga Ngomo, che dirige il gruppo di lavoro Data Science presso l’Università di Paderborn. In altre parole: non c’è conversazione tra mittente e destinatario. Ngonga aggiunge: “Il problema può essere superato attraverso la co-costruzione di spiegazioni, per cui i destinatari – cioè gli esseri umani – sono più coinvolti nel processo di spiegazione guidato dall’intelligenza artificiale, con spiegazioni non solo prodotte per loro, ma con loro”.
Incentrato sull’uomo: apprendimento automatico per applicazioni su larga scala
Il concetto di co-costruzione non è stato ancora utilizzato per i grafi della conoscenza. I ricercatori si sono quindi posti l’obiettivo di sviluppare approcci di apprendimento automatico spiegabili per grafi di conoscenza particolarmente grandi, con particolare attenzione al calcolo rapido di modelli e spiegazioni incentrate sull’uomo. Ngonga parla di lavoro pionieristico: “Per raggiungere questo obiettivo, ENEXA elaborerà nuovi approcci ibridi di apprendimento automatico in grado di sfruttare rappresentazioni multiple di grafici della conoscenza in modo simultaneo. Le soluzioni sviluppate soddisferanno i requisiti di runtime del mondo reale e renderanno accessibile l’apprendimento automatico spiegabile per applicazioni su larga scala come i motori di ricerca Internet, la contabilità, il marketing del marchio e l’analisi predittiva delle immagini satellitari. Utilizzando l’apprendimento automatico ibrido per grandi grafici di conoscenza e per spiegarli, ENEXA aprirà la strada all’implementazione di modelli esplicativi della sociologia e della psicologia nell’apprendimento automatico. Questo è importante perché le persone spesso devono prendere decisioni senza essere sempre chiare sui fatti, che possono quindi avere conseguenze di vasta portata.
Vantaggi per l’industria
L’uso dell’intelligenza artificiale per i grafici della conoscenza ha anche vantaggi per l’industria. Secondo i ricercatori, tuttavia, ci sono alcuni problemi qui: “I framework di estrazione e archiviazione della conoscenza in grado di tradurre i dati industriali in grandi grafici della conoscenza e archiviare i risultati in modo distribuito sono ancora scarsi. Anche lo sviluppo di algoritmi di intelligenza artificiale scalabili in grado di elaborare previsioni per set di dati grandi, incoerenti o incompleti in un ragionevole lasso di tempo rappresenta ancora una sfida. Un’altra sfida è fornire tecniche per produrre spiegazioni comprensibili dai risultati generati dalla macchina, per garantire che i modelli calcolati siano affidabili», afferma Ngonga. Il team sta quindi lavorando allo sviluppo di algoritmi che soddisfino questi requisiti chiave.
Il percorso verso l’obiettivo: tre casi d’uso
“L’obiettivo principale di ENEXA è ideare approcci di apprendimento automatico spiegabili per grafici della conoscenza che superino in modo significativo lo stato dell’arte in termini di tempo di esecuzione, quantità di dati da elaborare (scalabilità), incoerenza dei dati (robustezza) e qualità della spiegazione.” riassume Ngonga. Sono stati scelti tre casi d’uso per applicare e convalidare questi approcci come parte del progetto. Il primo è in collaborazione con la società DATEV, che elabora più di 60 milioni di ricevute digitali al mese da circa 960.000 PMI e istituzioni pubbliche tedesche. Queste ricevute contabili rilevanti devono essere classificate correttamente e interpretate per generare record di registrazione validi e legalmente conformi. In questo processo la qualità e la tracciabilità giocano un ruolo cruciale, in modo da ridurre al minimo gli errori e quindi i costi e garantire il rispetto dei requisiti di legge. La qualità dei risultati dell’automazione dipende fortemente dalla base di dati e dalla sua preparazione per l’apprendimento automatico. In collaborazione con gli scienziati, nel corso del progetto verranno ricercati nuovi approcci per processi più efficienti e quindi a risparmio di risorse utilizzando grafici della conoscenza.
Il secondo caso d’uso viene svolto in collaborazione con il Centro satellitare dell’Unione europea (SatCen), un’agenzia dell’UE con sede in Spagna. SatCen fornisce prodotti e servizi di intelligence geospaziale derivanti dallo sfruttamento delle risorse di osservazione della Terra e dei dati collaterali. Una di queste fonti sono i dati dei satelliti Sentinel. Questi satelliti di osservazione della Terra fanno parte del programma Copernicus dell’Unione europea e producono enormi volumi di dati che possono essere combinati con grafici di conoscenza geospaziale per estrarre in modo efficiente informazioni rilevanti da esso. Il team di ENEXA sta cercando di sviluppare nuove tecniche di grafici della conoscenza per migliorare la gestione e l’analisi di tali dati.
Il terzo caso d’uso riguarda il miglioramento delle strategie di comunicazione del marchio in collaborazione con la tecnologia webLyzard. L’azienda utilizza i grafici della conoscenza come conoscenza di base per associare la conoscenza affettiva ai marchi dei consumatori e prevedere gli sviluppi futuri al fine di derivare strategie basate sui dati. La tecnologia webLyzard elabora fino a 100 milioni di documenti al giorno. L’obiettivo è ottenere risultati di classificazione significativi che portino le aziende a distribuire comunicati stampa o inserire annunci online per promuovere i propri contenuti a intervalli di tempo specifici che massimizzino la copertura tra specifici gruppi target. Gli approcci attuali non sono in grado di gestire questo volume di dati.
Interdisciplinarietà
Un certo numero di ricercatori provenienti da una varietà di discipline diverse stanno lavorando insieme per garantire il successo del progetto ENEXA, tra cui linguisti computazionali, psicologi, informatici e sviluppatori di software. Questo approccio collaborativo mira a fornire nuove risposte alle sfide sociali, economiche e imprenditoriali legate all’intelligenza artificiale. Fondamentalmente, si tratta della partecipazione umana ai sistemi socio-tecnici. Il team si aspetta di vedere i primi risultati già nel 2023.
Ulteriori informazioni possono essere trovate qui: http://enexa.eu .
*ENEXA sta per “Efficient Explainable Learning on Knowledge Graphs”.