DEEPMIND RILASCIA ACME: UN FRAMEWORK PER RIDURRE LE COMPLESSITÀ NEI FLUSSI DI LAVORO AI

DeepMind, il 1 ° giugno, ha rilasciato Acme , un framework per la creazione di algoritmi RL affidabili, efficienti e orientati alla ricerca. Secondo i ricercatori, l’idea alla base della costruzione del framework Acme era di ridurre la complessità delle soluzioni basate su ML, oltre a aiutare i ricercatori e le aziende a ridimensionare senza sforzo.

Mentre abbiamo assistito a importanti progressi nel deep learning e nel potere computazionale, anche le complessità nello sviluppo di solide soluzioni sono aumentate rapidamente. Tali sfide, secondo gli autori dell’articolo, hanno aumentato le difficoltà per i ricercatori di prototipare rapidamente le idee, causando quindi gravi problemi di riproducibilità.

La riproducibilità ha portato numerose critiche ai modelli basati sull’intelligenza artificiale poiché ha diminuito la fiducia tra gli utenti. Tuttavia, con Acme, i ricercatori di DeepMind credono che il framework mitigherà le sfide della riproducibilità e semplificherà il processo per i ricercatori di sviluppare algoritmi innovativi e creativi. Con Acme, si sarà in grado di ridimensionare garantendo agli agenti RL di fornire i risultati desiderati.

I ricercatori di DeepMind hanno tenuto presente vari principi di progettazione che consentiranno agli sviluppatori di creare, testare ed eseguire il debug degli agenti RL in scenari su piccola scala, prima di ridimensionarli. Acme sfrutta anche Reverb , un efficiente sistema di archiviazione dei dati progettato appositamente per i flussi di lavoro di machine learning. Tuttavia, Acme supporta altre rappresentazioni della struttura dei dati come FIFO e le code di priorità per semplificarne l’utilizzo per gli algoritmi on e off-policy.

Reverb è stato aperto da DeepMind il 26 maggio 2020, per semplificare l’archiviazione e il trasporto dei dati per prodotti basati su ML. È un sistema altamente flessibile ma principalmente utilizzato come sistema di riproduzione dell’esperienza per algoritmi di apprendimento distribuito di rinforzo.

Di ihal