Perché gli investitori dovrebbero concentrarsi maggiormente sull’infrastruttura a supporto della rivoluzione dell’IA
L’intelligenza artificiale è stata annunciata come il catalizzatore di una nuova rivoluzione industriale. Sebbene il potenziale per un impatto enorme sia molto reale, gli investitori di venture capital che cercano di capitalizzare la crescita dovrebbero dedicare più tempo a considerare l’infrastruttura abilitante.
Sebbene le applicazioni siano una miriade e diverse, dalla scoperta di farmaci alle auto senza conducente, l’adozione pratica nell’impresa è stata poco brillante. Solo 1 leader aziendale su 20 descriverebbe le proprie aziende come “implementando l’IA ampiamente in tutta l’organizzazione”.
Il punto di partenza per identificare queste opportunità di investimento è la decostruzione del flusso di lavoro dell’IA, estraendo ogni fase del processo, dall’aggregazione all’implementazione e cercando efficienza, scalabilità e accesso.
PROMOSSA
Un approccio all’investimento basato sull’infrastruttura ha il potenziale per produrre maggiori rendimenti di venture capital con un profilo di rischio inferiore. Guardando al mercato degli smartphone, ad esempio, è improbabile che un investitore nel 2005 avrebbe potuto prevedere con precisione che oggi Google, un motore di ricerca su Internet, avrebbe un’attività mobile 5 volte più grande di quella di Nokia. Detto questo, fare ampi investimenti nei principali produttori di chip avrebbe identificato con precisione Qualcomm come un fornitore le cui parti hanno supportato l’aumento della tecnologia mobile.
Assistente altoparlante intelligente con intelligenza artificiale
È meno difficile identificare la tecnologia che supporta l’IA piuttosto che prevedere l’assistente vocale del … [+] GETTY
Le innovazioni nell’intelligenza artificiale sono entusiasmanti, ma è meno difficile identificare e scommettere sulle tecnologie che supportano l’IA piuttosto che prevedere chi fornirà l’assistente vocale del futuro. Il punto di partenza per identificare queste opportunità di investimento è la decostruzione del flusso di lavoro dell’IA, estraendo ogni fase del processo, dall’aggregazione all’implementazione e cercando efficienza, scalabilità e accesso.
Cosa significa rendere operativa l’IA?
Il processo di creazione e distribuzione di strumenti di intelligenza artificiale può essere suddiviso in due fasi: formazione e inferenza. La formazione è il processo mediante il quale un framework per l’apprendimento profondo viene applicato a un set di dati. Tali dati devono essere pertinenti, sufficientemente grandi e ben etichettati per garantire che il sistema venga addestrato in modo appropriato. Inoltre, i modelli di apprendimento automatico creati devono essere convalidati per evitare l’adattamento eccessivo ai dati di addestramento e per mantenere un livello di generalizzabilità. La parte inferenziale è l’applicazione di questo modello e il monitoraggio continuo per identificarne l’efficacia.
Per questa valutazione, le tre fasi più interessanti sono l’acquisizione, la preparazione e l’implementazione, poiché hanno probabilmente raccolto la minima attenzione degli investitori.
Il ciclo di vita dello sviluppo AI / ML
Rappresentazione virtuale di una grande memoria o cervello di intelligenza artificiale
All’interno delle fasi di sviluppo sopra menzionate, possiamo immaginare un ciclo di vita di sviluppo più completo. Queste fasi sono le seguenti: acquisizione dei dati, preparazione dei dati, addestramento, inferenza e implementazione. Per questa valutazione, le tre fasi più interessanti sono l’acquisizione, la preparazione e l’implementazione, poiché hanno probabilmente raccolto la minima attenzione degli investitori.
Acquisizione dei dati
Il processo di formazione dipende dai dati appropriati per l’obiettivo aziendale definito. Dove acquisiscono questi dati le aziende che stanno sviluppando modelli interni? Per alcuni, questi dati sono dati interni dei clienti. Ciò è particolarmente rilevante per le grandi aziende di consumo che raccolgono dati da tempo. L’utilizzo dei dati storici dei clienti è, generalmente, una proposta poco costosa, ma può comportare problemi relativi alla pulizia e alla completezza dei dati.
Cosa fanno le aziende senza set di dati storici per addestrare i propri modelli? Si affidano a set di dati disponibili pubblicamente o acquistano i dati direttamente. Stanno emergendo fornitori come Narrative che si concentrano principalmente sulla vendita di set di dati puliti e ben etichettati in modo esplicito per casi d’uso di machine learning. Ad oggi, il mercato rimane relativamente frammentato e difficile per le organizzazioni ottenere i dati di cui hanno bisogno. È difficile valutare se la narrativa avrà successo o meno, ma la loro soluzione basata sul mercato è probabilmente il modello che avrà successo. Piattaforme come OpenML e Amazon Dataset hanno caratteristiche simili a quelle del mercato ma sono interamente open source. Ciò creerà sempre una barriera per alcuni fornitori di dati che insistono sulla monetizzazione dei loro set di dati.
Preparazione dei dati
La preparazione dei dati, indipendentemente dal fatto che i dati siano interni a un’organizzazione o acquistati, è fondamentale per l’addestramento di modelli di machine learning efficaci. Come descritto in Data mining: strumenti e tecniche di machine learning pratici , “La preparazione implica la pre-elaborazione dei dati grezzi in modo che gli algoritmi di machine learning possano produrre un modello, idealmente una descrizione strutturale delle informazioni implicite nei dati”.
Un dataset di un migliaio di immagini di traffico può avere la presenza di una caratteristica particolare, ad esempio un segnale di “Stop” notato, ma verificare ogni immagine è un compito enorme. Questa attività, nota come etichettatura dei dati, diventa ancora più monumentale quando si esaminano set di dati ancora più grandi.
A destra del paragrafo precedente: collage di segnali di stop o immagini del traffico Oggi, le piattaforme che facilitano l’etichettatura dei dati possono supportare diverse parti del processo: input umano grezzo per etichettare i dati, facilitazione della collaborazione, gestione dei dati o fungere da livello di automazione che accelera il processo di etichettatura. Ci sono diversi concorrenti nello spazio che cercano tutti di gestire la preparazione dei dati da un punto all’altro e stanno iniziando a raggiungere anche altre parti del processo. Labelbox, ad esempio, ha recentemente raccolto una serie B da $ 25 mm da Andreesen Horowitz. Inoltre, aziende come Hive , Cloudfactory e Scale AI sono tutte in competizione nello spazio.
Implementazione
La componente di implementazione del ciclo di vita dello sviluppo dell’IA è complessa e comprende non solo l’implementazione del modello nel mondo reale, ma anche la valutazione continua. Per fare ciò è necessario creare una pipeline di dati in grado di gestire la formazione continua, il ridimensionamento e la gestione delle risorse di elaborazione, lo sviluppo del controllo della versione e l’integrazione di strumenti di monitoraggio.
Gli investitori prudenti, tuttavia, dovrebbero cercare società innovative che guidino la separazione e concentrandosi su aspetti del processo di implementazione che sono particolarmente dolorosi per le imprese.
Amazon e Google hanno riconosciuto questa necessità di supportare le aziende che stanno cercando di distribuire applicazioni basate sull’intelligenza artificiale e hanno sviluppato un ecosistema di strumenti pertinenti. Con piattaforme come Sagemaker , Amazon non fornisce solo uno strumento per facilitare la distribuzione, ma anche un intero servizio gestito che include interventi umani per monitorare i modelli distribuiti. Data la natura nascente dello spazio, probabilmente ci sarà una separazione. Nel frattempo, la maggior parte delle aziende sta cercando di affrontare cose end-to-end, come Algorithmia e Dataiku .
In attesa di opportunità nello spazio delle infrastrutture AI
Gli investitori prudenti, tuttavia, dovrebbero cercare società innovative che guidino la separazione e concentrandosi su aspetti del processo di implementazione che sono particolarmente dolorosi per le imprese. Questo potrebbe essere semplice come un monitoraggio più accurato dei modelli implementati, qualcosa che può essere facilmente trascurato ma fornisce un enorme valore ai clienti.
Man mano che emergono nuovi team e processi per sviluppare e distribuire l’intelligenza artificiale in modo più ampio, saranno necessarie piattaforme che supportino la loro operatività. Queste piattaforme rappresentano un’opportunità fenomenale per gli investitori e dovrebbero continuare a decostruire il ciclo di sviluppo AI / ML per cercare investimenti.