La ricerca modelli di Google ottimizza e identifica automaticamente i modelli AI
Google ha annunciato oggi il rilascio di Model Search , una piattaforma open source progettata per aiutare i ricercatori a sviluppare modelli di machine learning in modo efficiente e automatico. Invece di concentrarsi su un dominio specifico, Google afferma che Model Search è indipendente dal dominio, il che lo rende in grado di trovare un’architettura modello che si adatti a un set di dati e un problema, riducendo al minimo il tempo di codifica e le risorse di calcolo.
Il successo di un modello di intelligenza artificiale dipende spesso da quanto bene può funzionare su vari carichi di lavoro. Ma progettare un modello che possa generalizzare bene può essere estremamente impegnativo. Negli ultimi anni sono emersi algoritmi AutoML per aiutare i ricercatori a trovare il modello giusto senza la necessità di sperimentazione manuale. Tuttavia, il più delle volte, questi algoritmi sono pesanti e richiedono migliaia di modelli per l’addestramento.
Model Search, che si basa sul framework di apprendimento automatico TensorFlow di Google e può essere eseguito su una o più macchine, è composto da più trainer, un algoritmo di ricerca, un algoritmo di transfer learning e un database per memorizzare i modelli valutati. Model Search esegue esperimenti di formazione e valutazione per i modelli di intelligenza artificiale in modo adattivo e asincrono, in modo tale che tutti i formatori condividano le conoscenze acquisite dai loro esperimenti mentre conducono ogni esperimento in modo indipendente. All’inizio di ogni ciclo, l’algoritmo di ricerca cerca tutte le prove completate e decide cosa provare dopo, dopodiché “muta” su una delle migliori architetture trovate fino a quel punto e assegna il modello risultante a un trainer.
Per migliorare ulteriormente l’efficienza e l’accuratezza, Model Search utilizza l’apprendimento del trasferimento durante gli esperimenti. Ad esempio, utilizza la distillazione della conoscenza e la condivisione del peso, che avvia alcune delle variabili nei modelli da modelli addestrati in precedenza. Ciò consente una formazione più rapida e, per estensione, opportunità per scoprire architetture più numerose e apparentemente migliori.
Dopo l’esecuzione di una ricerca modello, gli utenti possono confrontare i numerosi modelli trovati durante la ricerca. Inoltre, possono creare il proprio spazio di ricerca per personalizzare gli elementi architettonici nei loro modelli.
Google afferma che in un esperimento interno, Model Search ha migliorato i modelli di produzione con iterazioni minime, in particolare nelle aree di individuazione di parole chiave e identificazione della lingua. È anche riuscito a trovare un’architettura adatta per la classificazione delle immagini sul set di dati di imaging open source CIFAR-10 ampiamente esplorato .
“Ci auguriamo che il codice Model Search fornisca ai ricercatori un framework flessibile e indipendente dal dominio per la scoperta di modelli di machine learning”, hanno scritto in un post sul blog l’ingegnere ricercatore di Google Hanna Mazzawi e il ricercatore Xavi Gonzalvo. “Basandoci sulle conoscenze precedenti per un determinato dominio, riteniamo che questo framework sia abbastanza potente da costruire modelli con prestazioni all’avanguardia su problemi ben studiati quando viene fornito uno spazio di ricerca composto da blocchi standard”.