5 attributi chiave per far funzionare ML in natura

La più grande preoccupazione per qualsiasi sviluppatore di machine learning è capire se i loro modelli funzionano al di fuori dei loro laboratori, nel mondo reale e in natura. L’emergere del ML pragmatico come dominio coincide con la crescente adozione dell’IA. Ma quando si può chiamare il loro sistema pragmatico?

Per costruire sistemi di apprendimento più solidi, è essenziale progettare parametri di riferimento per gli attributi di questi compiti secondari. Ancor prima, dobbiamo definire quali sono queste attività secondarie e i loro attributi. Secondo i ricercatori dell’Università di Washington, ci sono 5 attributi chiave, la cui contabilità può far funzionare l’apprendimento automatico nel mondo reale.

Ecco i 5 attributi desiderati di un sistema di apprendimento automatico pragmatico:

Capacità di apprendere in modo sequenziale
I ricercatori affermano che i sistemi di apprendimento automatico che apprendono in natura devono essere in grado di elaborare i dati come appaiono, in sequenza . Il sistema deve essere in grado di produrre inferenze dai dati che incontra, aggiornandosi anche in sequenza. Tuttavia, l’apprendimento in modo sequenziale, hanno scritto i ricercatori, è l’obiettivo principale dell’apprendimento continuo ed è una sfida di vecchia data. Chiamano questo disastro catastrofico nelle macchine quando i modelli rilasciano i loro punteggi di precisione su attività precedenti quando vengono aggiornati o addestrati per affrontare nuove attività.

A questo proposito, sono emerse tecniche come l’apprendimento a pochi colpi e l’apprendimento del mondo aperto, che i ricercatori chiamano conseguenze naturali dell’apprendimento in modo sequenziale. La nozione di apprendimento one-shot ruota attorno all’idea che quando un sistema incontra qualcosa di nuovo, dovrebbe identificarlo e sfruttarlo.

W3Schools
Essere flessibili
Va da sé che l’intelligenza è spesso associata all’adattamento. Nel caso delle macchine, l’analogia più vicina può essere estratta dai sistemi di apprendimento del rinforzo con ricompense che spingono l’intero sistema a raggiungere l’obiettivo attraverso l’adattamento. Anche questo non è sufficiente poiché la maggior parte dei casi d’uso è codificata nel sistema ad eccezione di successi come AlphaGo .

I ricercatori affermano che i sistemi efficaci in natura devono essere abbastanza flessibili da prendere decisioni nel corso della loro vita riguardo a quali dati addestrare e cosa ignorare. È anche importante identificare la differenza tra le strategie di apprendimento e l’aggiornamento dei parametri del modello, il che è in contrasto con i paradigmi dell’apprendimento come l’apprendimento supervisionato, a scatti brevi e continui che in genere impongono restrizioni fisse e preimpostate agli studenti.

Contabilità I costi
I sistemi pragmatici, hanno scritto gli autori, devono essere in grado di catturare anche l’efficienza delle strategie di aggiornamento. Incorporare l’aggiornamento stesso non rende i sistemi più efficienti. Raccomandano che il sistema non debba solo misurare il costo di inferenza, ma anche aggiornare il costo. Il compromesso tra accuratezza e calcolo a vita è la chiave per progettare sistemi adeguati.

Open World Learning
Ogni volta che vengono rilevati dati, devono essere in grado di determinare se appartengono a una categoria esistente o devono appartenere a una nuova. Un sistema dovrebbe identificare una nuova categoria di funzionalità come qualcosa di nuovo. Ciò consente il pragmatismo in natura. Il rilevamento fuori dalla distribuzione è uno di questi approcci, che consente l’apprendimento del mondo aperto. Si occupa del rilevamento di classi invisibili in cui la distribuzione è statica. I sistemi allo stato brado devono essere in grado di apprendere in un ambiente a mondo aperto, dove le classi, e persino il numero di classi, non sono note allo studente.

Pochi o molti tiri di apprendimento?
Un sistema efficiente cattura l’essenza dell’intero set di dati semplicemente guardandolo alcune volte. Proprio come gli umani percepiscono gli oggetti semplicemente guardando le loro ombre. L’apprendimento con pochi scatti è diventato piuttosto popolare con la crescente vastità di set di dati. L’impostazione sperimentale per pochi scatti consiste in genere di modelli che vengono addestrati sulle classi di base durante il “meta-allenamento” e quindi testati su nuove classi in “meta-test”. I ricercatori sostengono che il modo di valutazione n-shot è troppo restrittivo in quanto presuppone che le distribuzioni dei dati durante i meta-test siano uniformi, il che è un presupposto non realistico nella pratica (in natura).

Al contrario, i modelli dovrebbero valutare i metodi attraverso una gamma di scatti.

FISSALO
Ora, dal momento che abbiamo elencato gli attributi chiave che possono abilitare la ML pragmatica, è anche essenziale sapere se esiste un framework unificante in grado di soddisfare le esigenze di questi sistemi. Gli stessi ricercatori dell’Università di Washington in collaborazione con Allen Institute of AI hanno introdotto un NED, un framework per la valutazione dei sistemi ML. Questo nuovo framework è progettato per allentare le decisioni di progettazione restrittive delle impostazioni precedenti e imporre meno restrizioni agli algoritmi di apprendimento.

Di ihal