Meta assume su Google, sfera della soluzione di ricerca white-box open-source
Sphere rappresenta lo sforzo di Meta per consentire ai ricercatori di intelligenza artificiale di sperimentare con la costruzione di modelli KI-NLP
Ti sei mai chiesto come Wikipedia o Ricerca Google rispondano alle nostre domande? Pensieri casuali ci colpiscono in momenti casuali e ci rivolgiamo a questi motori di ricerca e alle enciclopedie online. In ogni caso, otteniamo le nostre risposte. Per lo più.
L’elaborazione del linguaggio naturale ad alta intensità di conoscenza (KI-NLP) è il modo in cui Ricerca Google o Wikipedia recuperano le risposte alle nostre domande. I modelli di intelligenza artificiale al loro interno scavano in un archivio di informazioni per fornirci risultati di ricerca pertinenti. Tuttavia, ci sono diverse limitazioni all’attuale panorama KI-NLP.
Le architetture KI-NLP dipendono dai motori di ricerca black-box per la ricerca di informazioni dal Web della conoscenza. Nel processo, le informazioni rilevanti possono essere perse poiché gli algoritmi dei motori di ricerca possono classificarle troppo in basso nei risultati. Inoltre, nel caso delle ricerche su Wikipedia, spesso l’enciclopedia online non cattura tutta la conoscenza disponibile sul web relativa a un particolare argomento e, con la sua continua crescita, è diventata una sfida verificare citazioni e altri pregiudizi.
Sfera di Meta
Meta ha ideato la prima soluzione di ricerca white-box, Sphere, che utilizza i dati Web aperti come fonte di conoscenza. Meta ritiene che la base di conoscenza della scatola bianca di Sphere abbia molti più dati e fonti da confrontare per la verifica rispetto a una tipica fonte di conoscenza della scatola nera. Pertanto, può fornire informazioni utili che non possono.
L’idea era quella di creare sistemi di intelligenza artificiale più intelligenti che potessero sfruttare la conoscenza del mondo reale in un modo migliore. Sphere ha superato il benchmark Knowledge Intensive Language Tasks, il che implica che può aiutare i ricercatori di intelligenza artificiale a costruire modelli in grado di sfruttare la conoscenza del mondo reale per svolgere più attività.
Sphere rappresenta lo sforzo di Meta per consentire ai ricercatori di intelligenza artificiale di sperimentare con la costruzione di modelli KI-NLP. Meta crede che Sphere aiuterà i ricercatori a formare i retriever per gestire una gamma più ampia di documenti e preparare sistemi automatici per affrontare questioni come la disinformazione e il testo incoerente. I modelli così creati potrebbero aiutare nel mondo reale ad affrontare i contenuti dannosi. Ha anche il potenziale per migliorare l’alfabetizzazione digitale e le capacità di pensiero critico.
Poco dopo che Meta ha rilasciato Sphere, sono iniziate le discussioni sul fatto che Meta sta cercando di sfidare Google.
“MetaAI introduce la ricerca in white box. Con l’open source Sphere, il suo corpus su scala web. Sfida direttamente Google”, ha pubblicato Prithivi Damodaran , un consulente ML presso Donkey Stereotype.
Con Sphere, Meta sta cercando di affrontare il problema della fonte più rilevante relativa alla domanda o all’argomento del surfista. In un momento in cui l’ottimizzazione dei motori di ricerca è ampiamente utilizzata per classificare facilmente le risorse informative, ciò che appare più in alto nei risultati di ricerca potrebbe non essere la fonte più rilevante per il navigatore. In effetti, la Ricerca Google è nota per i suoi risultati di ricerca. Ci sono state numerose lamentele da parte degli utenti sul fatto che i risultati di ricerca di Google fossero errati e irrilevanti. Molte volte, i risultati iniziali riguardano annunci o informazioni nemmeno lontanamente correlate alla query. Sfera cerca di risolvere questo problema.
Un altro modo in cui Meta sta cercando di superare Google con Sphere è open sourcing . Le grandi aziende tecnologiche come Google sono state spesso criticate per essere opache con la loro ricerca sul ML. Non forniscono alcuna informazione su come sono stati creati tali modelli o quali dati sono stati applicati portando alla crisi della replicazione dell’IA.
La crisi della replica è davvero un grosso problema in quanto può portare a molti altri problemi. Se un team di ricerca sull’intelligenza artificiale non fornisce alcuna informazione sul suo modello di intelligenza artificiale, la comunità più ampia non viene a sapere se sta utilizzando un set di dati distorto per addestrare il modello. Improvvisamente, produce risultati distorti quando viene introdotto nel mondo reale. Prendi il caso di Google Vision Cloud, che etichettava l’immagine di un individuo dalla pelle scura che impugnava un termometro come una “pistola” mentre un’immagine simile con un individuo dalla pelle chiara era come un “dispositivo elettronico”.
Traiettoria futura
Se Sphere si sposterà come vuole Meta, è questione di tempo. Tuttavia, il lavoro di Meta su un corpus su scala web come Sphere mostra il potenziale che sfruttare le vaste risorse testuali disponibili online oggi attraverso il recupero di white box potrebbe essere la prossima grande svolta nella PNL .
Tuttavia, i problemi esistono. Uno dei problemi chiave che Meta intende affrontare riguarda la qualità delle informazioni recuperate. I modelli NLP dovrebbero essere in grado di valutare la qualità dei documenti recuperati, gestire i duplicati, rilevare potenziali false affermazioni e contraddizioni, dare priorità a fonti più affidabili e astenersi dal fornire la risposta se non esistono prove sufficientemente valide nel corpus.