KNAS di Alibaba, un algoritmo AutoML a basso consumo

Diihal

Feb 15, 2022

Alibaba open-source KNAS, un algoritmo AutoML a basso consumo
KNAS utilizza un kernel gradiente come proxy per la qualità del modello e consuma meno risorse di calcolo rispetto alle tecniche standard.

I ricercatori di Alibaba Group e della Peking University hanno creato un efficiente algoritmo AutoML chiamato Kernel Neural Architecture Search. Lo studio ha cercato una soluzione NAS (Neural Architecture Search) verde che valuti le architetture senza formazione.

KNAS utilizza un kernel gradiente come proxy per la qualità del modello e consuma meno risorse di calcolo rispetto alle tecniche standard. Il team ha proposto l’ipotesi: “I gradienti possono essere utilizzati come proxy a grana grossa dell’allenamento a valle per valutare architetture inizializzate casualmente”. I ricercatori hanno scoperto che un kernel gradiente (la media della matrice di Gram (MGM) dei gradienti) ha una forte correlazione con l’accuratezza di un modello. L’algoritmo KNAS calcola l’ MGM per ogni architettura del modello proposta, mantenendo solo i pochi migliori, calcolando l’accuratezza del modello per quei candidati e selezionando il modello con la massima precisione come risultato finale.

Di solito, i sistemi di ricerca dell’architettura neurale vengono utilizzati per trovare la migliore architettura del modello di apprendimento profondo per un’attività. Il sistema lo fa trovando un’architettura adatta a fornire la migliore metrica delle prestazioni sul dataset di attività specificato e lo spazio di ricerca delle possibili architetture. Tuttavia, questo metodo richiede l’addestramento completo di ciascun modello proposto sul set di dati, con conseguenti tempi di addestramento più lunghi.

KNAS di Alibaba, un algoritmo AutoML a basso consumo

Diihal

Di ihal

Articoli correlati

L’AI di Ventusky per previsioni di grandine a portata di mano

Vibe Coding: nonno di 91 anni crea un’app per la Chiesa con Claude e Replit

Anthropic Claude trasforma ogni utente in uno sviluppatore di app no-code

You missed

Rendering neurale: arriva NVIDIA DiffusionRenderer per video realistici

Salesforce presenta GTA1, agente GUI che supera OpenAI CUA nei benchmark

Meta acquisisce PlayAI per potenziare l’AI vocale nel suo Superintelligence Lab

Anthropic propone un quadro di trasparenza per l’AI avanzata tra sicurezza, responsabilità e flessibilità