Le tue abilità di intelligenza artificiale valgono meno di quanto pensi
Ryszard Szopa da Medium
Siamo nel bel mezzo di un boom di intelligenza artificiale. Gli esperti di Machine Learning comandano salari straordinari, gli investitori sono felici di aprire i loro cuori e libretti degli assegni quando incontrano le startup AI. E giustamente: questa è una di quelle tecnologie di trasformazione che si verificano una volta per generazione. La tecnologia è qui per rimanere, e cambierà le nostre vite.
Ciò non significa che rendere il tuo avvio IA successo è facile. Penso che ci siano alcune insidie importanti davanti a chiunque cerchi di costruire il proprio business intorno all’IA .
Mio figlio e io, immagine elaborata usando Artistic Style Transfer. Questa tecnica ha suscitato il mio interesse per il Deep Learning.
Il valore delle tue abilità di intelligenza artificiale sta diminuendo
Nel 2015 ero ancora su Google e ho iniziato a giocare con DistBelief (che in seguito avrebbero rinominato in TensorFlow ). Ha fatto schifo. È stato doloroso imbarazzante scrivere, le astrazioni principali non erano del tutto all’altezza delle aspettative. L’idea di farla funzionare al di fuori del sistema di costruzione di Google era un sogno irrealizzabile.
Alla fine del 2016 stavo lavorando a un proof of concept per rilevare il cancro al seno nelle immagini istopatologiche. Volevo utilizzare il trasferimento di apprendimento : prendi Inception , la migliore architettura di classificazione delle immagini di Google al momento, e riqualificale sui miei dati sul cancro. Userei i pesi da un Inception preliminare come previsto da Google, semplicemente cambiando i livelli più alti per corrispondere a quello che stavo facendo. Dopo un lungo periodo di tentativi ed errori in TensorFlow, ho finalmente capito come manipolare i diversi livelli e ho funzionato per lo più. Ci sono volute molte perseveranze e leggendo le fonti di TensorFlow. Almeno non dovevo preoccuparmi troppo delle dipendenze, poiché il popolo di TensorFlow preparava pietosamente un’immagine di Docker.
All’inizio del 2018 il compito da sopra non era adatto per il primo progetto di un tirocinante, a causa della mancanza di complessità. Grazie a Keras (un framework in cima a TensorFlow) è possibile farlo in poche righe di codice Python e non è necessaria una profonda comprensione di ciò che stavi facendo. Quello che era ancora un po ‘un dolore era l’accordatura iperparametrica. Se si dispone di un modello Deep Learning, è possibile manipolare più manopole come il numero e la dimensione dei layer, ecc. Come ottenere la configurazione ottimale non è banale, e alcuni algoritmi intuitivi (come la ricerca della griglia) non funzionano bene. Hai finito per eseguire molti esperimenti, e sembrava più un’arte che una scienza.
Mentre sto scrivendo queste parole (inizio 2019), Google e Amazon offrono servizi per l’ottimizzazione automatica dei modelli ( Cloud AutoML , SageMaker ), Microsoft ha intenzione di farlo . Prevedo che la sintonizzazione manuale sta andando a dodo, e buona liberazione.
Spero che tu veda lo schema qui. Ciò che è stato difficile diventa facile, puoi ottenere di più comprendendo di meno. Le grandi imprese ingegneristiche del passato sembrano piuttosto noiose, e non dovremmo aspettarci che le nostre imprese presenti andranno meglio in futuro. Questa è una buona cosa e un segno di incredibili progressi. Dobbiamo questo progresso a società come Google, che stanno investendo pesantemente negli strumenti e quindi li offrono gratuitamente. Il motivo per cui lo fanno è duplice.
Il tuo ufficio dopo che sei stato mercificato.
Innanzitutto, si tratta di un tentativo di personalizzare il complemento del loro prodotto reale, che è l’infrastruttura cloud. In economia, due beni sono complementari se si tende a comprarli insieme. Alcuni esempi: automobili e benzina, latte e cereali, bacon e uova. Se il prezzo di uno dei complementi scende, la richiesta dell’altro aumenterà. Il complemento al cloud è il software su cui gira, e la roba AI ha anche la bella proprietà che richiede molte risorse computazionali. Quindi, ha molto senso rendere il suo sviluppo il più economico possibile.
La seconda ragione per cui Google in particolare è così entusiasta dell’IA è che hanno un chiaro vantaggio comparativo rispetto ad Amazon e Microsoft. Hanno iniziato prima, e sono stati loro a rendere popolare il concetto di Deep Learning, quindi sono riusciti a strappare un sacco di talento. Hanno una maggiore esperienza nello sviluppo di prodotti di intelligenza artificiale e ciò li rende un vantaggio quando si tratta di sviluppare strumenti e servizi necessari per loro.
Per quanto il progresso sia eccitante, è una brutta notizia sia per le aziende che per gli individui che hanno investito molto in competenze di intelligenza artificiale . Oggi, ti danno un solido vantaggio competitivo, poiché addestrare un ingegnere ML competente richiede molto tempo per leggere i documenti e un solido background matematico per iniziare. Tuttavia, man mano che gli strumenti migliorano, non sarà più così. Diventerà più sulla lettura di tutorial che su articoli scientifici. Se non ti rendi conto presto del tuo vantaggio , una banda di stagisti con una biblioteca può mangiare il tuo pranzo . Soprattutto se i tirocinanti hanno dati migliori, il che ci porta al prossimo punto …
I dati sono più importanti delle architetture AI fantasiose
Diciamo che hai due fondatori di startup AI, Alice e Bob. Le loro società hanno raccolto la stessa quantità di denaro e sono in feroce competizione per lo stesso mercato. Alice investe nei migliori ingegneri, dottori di ricerca con una buona esperienza nella ricerca di intelligenza artificiale. Bob assume ingegneri mediocri ma competenti e la investe (“Bob” è l’abbreviazione di Roberta!) Denaro per ottenere dati migliori. Su quale società scommetterei i tuoi soldi?
I miei soldi sarebbero esattamente su Bob . Perché? Essenzialmente, l’apprendimento automatico funziona estraendo le informazioni da un set di dati e trasferendole sui pesi del modello. Un modello migliore è più efficiente in questo processo (in termini di tempo e / o qualità generale), ma assumendo alcune linee di base di adeguatezza (cioè, il modello sta effettivamente imparando qualcosa) i dati migliori supereranno l’architettura migliore .
Per illustrare questo punto, facciamo un test rapido e sporco. Ho creato due semplici reti convoluzionali, una “migliore” e una “peggiore”. Lo strato denso finale del modello migliore disponeva di 128 neuroni, mentre quello peggiore doveva essere eseguito con solo 64. Li ho addestrati su sottoinsiemi del set di dati MNIST di dimensioni crescenti, e tracciato la precisione dei modelli sul set di test rispetto al numero di campioni su cui sono stati addestrati.
Il blu è il modello “migliore”, verde il modello “peggiore”.
L’effetto positivo della dimensione del set di dati dell’allenamento è ovvio (almeno fino a quando i modelli non inizieranno a superare i livelli più alti e quelli più accurati). Il mio modello “migliore”, la linea blu, supera nettamente il modello “peggiore”, la linea verde. Tuttavia, quello che voglio sottolineare è che la precisione del modello “peggiore” addestrato su 40mila campioni è migliore rispetto al modello “migliore” a 30mila campioni!
Nel mio esempio di giocattolo abbiamo a che fare con un problema relativamente semplice e abbiamo un set di dati completo. Nella vita reale, di solito non abbiamo un tale lusso. In molti casi, non si sfugge mai alla parte del grafico in cui l’aumento del set di dati ha un effetto così drammatico.
Inoltre, gli ingegneri di Alice non competono solo con la gente di Bob. A causa della cultura aperta della comunità di intelligenza artificiale e della sua enfasi sulla condivisione delle conoscenze, sono anche in competizione con i ricercatori di Google, Facebook, Microsoft e migliaia di università in tutto il mondo . Prendere l’architettura più performante attualmente descritta in letteratura e riqualificarla sui propri dati è una strategia collaudata in battaglia se il tuo obiettivo è risolvere un problema (invece di dare un contributo originale alla scienza). Se al momento non c’è nulla di veramente buono, è spesso questione di aspettare un quarto o due finché qualcuno non si presenta con una soluzione. Soprattutto che puoi fare cose come ospitare una competizione di Kaggle per incentivare i ricercatori a esaminare il tuo particolare problema.
Una buona ingegneria è sempre importante, ma se si sta facendo AI, i dati sono ciò che crea il vantaggio competitivo. La domanda da un miliardo di dollari è, tuttavia, se si sarà in grado di mantenere il proprio vantaggio.
Nell’IA, mantenere il tuo vantaggio competitivo è difficile
Con il suo set di dati superiore, Bob riesce a competere con Alice, e sta andando alla grande. Lancia il suo prodotto e guadagna costantemente quote di mercato. Può persino iniziare a ingaggiare ingegneri migliori, poiché la parola sulla strada è che la sua azienda è il posto dove stare.
Foto di Alex Holyoake su Unsplash
Chuck ha qualcosa da recuperare, ma ha molto più denaro di Bob. Questo è importante quando si tratta di costruire il set di dati. È molto difficile accelerare un progetto di ingegneria lanciandogli dei soldi. In effetti, assegnare troppe persone nuove può ostacolare lo sviluppo. La creazione di un set di dati, tuttavia, è un diverso tipo di problema. Di solito, richiede un sacco di lavoro manuale umano – e puoi facilmente scalarlo assumendo più persone. Oppure potrebbe essere che qualcuno abbia i dati – allora tutto quello che devi fare è pagare una licenza. In ogni caso – i soldi fanno andare molto più veloce.
Perché Chuck è stato in grado di raccogliere più soldi di Bob?
Quando un fondatore alza un round, stanno cercando di bilanciare due obiettivi potenzialmente in contrasto tra loro. Hanno bisogno di raccogliere abbastanza soldi per essere in grado di vincere. Ma non possono raccogliere troppi soldi, perché ciò porterà a un’eccessiva diluizione. Assumere un investitore esterno significa vendere una parte dell’azienda. Il team di fondatori deve mantenere una partecipazione sufficientemente alta nella startup, per timore che perdano la motivazione (gestire una startup è un lavoro duro!).
Gli investitori, d’altra parte, vogliono investire in idee che hanno un potenziale potenziale enorme, ma devono controllare i rischi. Con l’aumentare del rischio percepito, chiederanno una fetta più grande della compagnia per ogni dollaro che pagano.
Quando Bob stava raccogliendo denaro, è stato un atto di fede che AI possa davvero aiutare con il suo prodotto. Indipendentemente dalle sue qualità di fondatore, o da quanto fosse buona la sua squadra, non era escluso che il problema che stava attaccando fosse semplicemente intrattabile . La situazione di Chuck è molto diversa. Sa che il problema è trattabile: il prodotto di Bob è la prova vivente!
Una delle potenziali risposte di Bob a questa sfida è l’aumento di un altro round. Dovrebbe essere in una buona posizione per quello, poiché (per il momento) è ancora in testa alla gara. Tuttavia, la situazione potrebbe essere più complicata. Cosa succede se Chuck può garantire l’accesso ai dati attraverso una relazione strategica? Ad esempio, immagina di parlare di un avvio di una diagnosi di cancro. Chuck potrebbe usare la sua posizione privilegiata in un’importante istituzione medica e assicurarsi un accordo amoroso con la suddetta istituzione . Potrebbe essere impossibile per Bob da abbinare quella .
Il tuo prodotto dovrebbe essere difendibile, idealmente avendo un profondo fossato.
Quindi, come andresti a costruire un vantaggio competitivo mantenibile per un prodotto AI? Qualche tempo fa ho avuto il piacere di parlare con Antonio Criminisi di Microsoft Research. La sua idea è che la salsa segreta del progetto non dovrebbe consistere solo in AI. Ad esempio, il suo progetto InnerEye utilizza AI evisione computerizzata classica (non basata su ML) per l’analisi di immagini radiologiche. In una certa misura, questo potrebbe essere in contrasto con il motivo per cui stai facendo una startup AI in primo luogo. La capacità di lanciare dati su un modello e vederli funzionare è incredibilmente attraente. Tuttavia, un componente software tradizionale, il cui genere richiede ai programmatori di pensare agli algoritmi e utilizzare un po ‘di duro per acquisire la conoscenza del dominio, è molto più difficile da riprodurre.
L’intelligenza artificiale è usata al meglio come una leva
Un modo per categorizzare qualcosa in un’azienda è se aggiunge valore direttamente o fornisce leva ad un’altra fonte di valore. Prendiamo una società di e-commerce come esempio. Se hai creato una nuova linea di prodotti hai aggiunto direttamente il valore. Non c’era niente, ora ci sono i widget e i clienti possono pagarli. Stabilire un nuovo canale di distribuzione, d’altra parte, è una leva. Iniziando a vendere i tuoi widget su Amazon, puoi raddoppiare il volume delle vendite. I costi di taglio sono anche leva. Se negozi un accordo migliore con il fornitore di widget cinese, puoi raddoppiare il tuo margine lordo.
Le leve hanno il potenziale per spostare l’ago oltre all’applicazione della forza diretta. Tuttavia, una leva funziona solo quando è accoppiato con una fonte di valore diretto. Un numero minuscolo non smette di essere piccolo se lo si raddoppia o triplica. Se non hai widget da vendere, ottenere un nuovo canale di distribuzione è una perdita di tempo.
Come dovremmo guardare all’IA in questo contesto? Ci sono molte aziende che cercano di rendere AI il loro prodotto diretto (API per il riconoscimento di immagini e simili). Questo può essere molto allettante se sei un esperto di intelligenza artificiale. Tuttavia, questa è un’idea singolarmente cattiva. Innanzitutto, sei in concorrenza con aziende come Google e Amazon. Secondo, creare un prodotto AI generico che sia veramente utile è pazzesco. Ad esempio, ho sempre desiderato utilizzare l’ API Vision di Google . Sfortunatamente, non ci siamo mai imbattuti in un cliente le cui esigenze sarebbero state adeguatamente abbinate dall’offerta. Era sempre troppo, o non abbastanza, e lo sviluppo personalizzato era preferibile all’esercizio del montaggio di un piolo quadrato in un buco rotondo.
Un’opzione molto migliore è trattare l’IA come una leva. Puoi prendere un modello aziendale esistente e funzionante e potenziarlo con l’intelligenza artificiale. Ad esempio, se si dispone di un processo che dipende dal lavoro cognitivo umano, automatizzarlo farà miracoli per i propri margini lordi. Alcuni esempi che posso pensare sono l’analisi ECG , l’ispezione industriale , l’ analisi dell’immagine satellitare . Ciò che è anche eccitante qui è che, poiché AI rimane nel back-end, hai alcune opzioni non-AI per costruire e mantenere il tuo vantaggio competitivo.
Conclusione
L’intelligenza artificiale è una tecnologia davvero rivoluzionaria. Tuttavia, basare la tua startup su di esso è un affare complicato. Non dovresti fare affidamento esclusivamente sulle tue abilità di intelligenza artificiale, in quanto sono deprezzanti a causa di tendenze di mercato più ampie. Costruire modelli di IA può essere molto interessante, ma ciò che conta davvero è avere dati migliori rispetto alla concorrenza. Mantenere un vantaggio competitivo è difficile, soprattutto se incontri un concorrente più ricco di te, il che è molto probabile che accada se la tua idea di IA decolla. Dovresti mirare a creare un processo di raccolta dati scalabile che è difficile riprodurre dalla concorrenza. L’intelligenza artificiale è ideale per distruggere le industrie che si affidano al lavoro cognitivo di umani poco qualificati, in quanto consente di automatizzare questo lavoro.