Viviamo in un momento storico. È in corso una nuova rivoluzione, paragonabile alla rivoluzione industriale. Intere industrie saranno interrotte. La natura della creatività e del lavoro di conoscenza cambierà. La lingua diventerà il senso più importante per gli esseri umani. Il linguaggio, in particolare sotto forma di modelli linguistici di grandi dimensioni (LLM), rimodellerà il modo in cui pensiamo al mondo che ci circonda.

 

 
Di tanto in tanto, la tecnologia raggiunge un punto di svolta che porta a un cambio di paradigma. Questo è ciò che sta accadendo ora, e siamo solo all’inizio. Gli LLM come GPT-3 stanno diventando davvero bravi a generare testo, riassumere testo, ragionare, capire, scrivere poesie e altro ancora. Sono il miglior completamento automatico al mondo. Stanno cambiando il modo in cui le persone scrivono codice, poesie, copie di marketing, saggi, documenti di ricerca e altro ancora. Non sostituiscono i posti di lavoro, ma li aumentano, rendendoci più produttivi.

 
Naturalmente, i LLM sono tutt’altro che perfetti e presentano molte sfide, come allucinazioni, allineamento e veridicità. Questi sono problemi difficili da risolvere, ma risolverli renderà questi modelli e applicazioni molto più affidabili e robusti.

Accendere l’ascesa di LLM
ChatGPT è stata la scintilla che ha acceso questo fuoco. Ha mostrato come le cose sono diventate reali quando è passato da zero a un milione di utenti in quattro giorni. La Silicon Valley ha iniziato a costruire grandi applicazioni e aziende in cima agli LLM, gettando le basi per le prossime aziende da trilioni di dollari. Stiamo anche assistendo alla nascita di nuovi settori costruiti prima con l’automazione e poi con l’uomo nel ciclo. Queste sono quelle che io chiamo aziende AI -first.

 

Una delle grandi gioie della vita è sperimentare l’arte che risuona con noi a livello emotivo. Man mano che l’IA generativa avanza, attendo con ansia i modi in cui ci consentirà di attingere ancora di più al nostro potenziale creativo, democratizzando il processo di autentica espressione di sé.

Ma come si costruisce un fossato attorno a questo? Come catturi il valore? A mio avviso, i fossati chiave per le prime applicazioni LLM/AI, in ordine di importanza, sono:

Dati proprietari e messa a punto
Ottima UX e che infonde un senso di fiducia e affidabilità
Costo di servizio/operatività
Distribuzione e GTM
Effetti di rete e comunità
Ampiezza e profondità delle integrazioni
Ecco cosa intendo per ampiezza e profondità delle integrazioni: i livelli sottili attorno alle API LLM non sono sufficienti per ottenere un vantaggio competitivo nelle app AI-first. Per vincere, hai bisogno di integrazioni profonde e flussi di lavoro ottimizzati che risolvano problemi reali con la scalabilità e l’efficienza che non erano possibili prima degli LLM. Ad esempio, immagina di utilizzare gli LLM per aumentare gli insegnanti per creare domande d’esame per gli studenti:

Fornire un collegamento al materiale contenuto
Recupero/scrapping del contenuto e analisi in un formato che gli LLM comprendano meglio
Chiedere agli LLM di creare domande da quel contenuto, date preferenze come difficoltà, ecc.
Utilizzo di LLM per scrivere risposte veritiere alle domande dal contenuto
Utilizzo delle risposte modificate per migliorare le future generazioni di domande
Questo è solo un esempio, ma ci sono molti verticali di cui sono entusiasta: automazione SDR end-to-end, generazione e refactoring del codice, automazione dell’assistenza clienti, scrittura di script, assistenti medici/sanitari e istruzione. Le app AI-first trasformeranno il modo in cui lavoriamo e collaboriamo nei prossimi cinque anni, rendendo il lavoro della conoscenza e l’intelligenza più accessibili e convenienti. Prendere appunti e proteggere i diritti d’autore sono solo la punta dell’iceberg. Nuove interfacce, CRM, copiloti per la preparazione delle tasse, assistenti alla ricerca sono tutti un gioco leale.

LLM ora e in futuro
Ecco come vedo le fasi dello sviluppo LLM:

1.0: Capace di generare un testo originale e di ragionarci sopra
2.0: in grado di evolversi, perfezionare il proprio output e acquisire nuove capacità per agire razionalmente
3.0: Sa progettare le proprie azioni/capacità di interagire con il mondo esterno
4.0+: sfrutta il volano dei dati per migliorare nel tempo e mantenersi
Il panorama LLM sta iniziando sempre più ad assomigliare a questo:

Livello del modello (ad es. GPT-3, Cohere)
Associazioni API per l’accesso (ad es. OpenAI Python)
Strato infra per concatenamento rapido/cambio di modello (ad es. LangChain, Humanloop)
App di nuova generazione basate sull’intelligenza artificiale
All’interno del livello infra, ci sono alcune aree che trovo sempre più interessanti: tooling/infra, no/low code , fine-tuning, prompt chaining and retrieval, azioni, framework di sperimentazione. La creazione di un livello affidabile e adattabile di infrastruttura e strumenti per LLM ci aiuterà a sbloccare il loro potere e valore per più utenti e applicazioni. Ad essere onesti, la ricchezza ricorsiva del concatenamento di prompt LLM rivoluzionerà interi settori. (O forse trovo le cose ricorsive particolarmente affascinanti.)

Inoltre, sono d’accordo sul fatto che la prossima generazione di prodotti nativi dell’IA integrerà alcuni elementi di combinazione di ragionamento e azione negli LLM per aiutare nel processo decisionale. Mi piace come la mette Denny Zhou: “Se gli LLM sono umani, tutte le idee sono banali: suggerimento di una catena di pensieri (“spiega la tua risposta”), autocoerenza (“ricontrolla la tua risposta”), almeno per- la maggior parte dei suggerimenti (“scomponi in sottoproblemi facili”). La cosa scioccante è che gli LLM non sono umani ma funzionano ancora!

Quindi, cogliamo l’opportunità di lavorare insieme a sistemi intelligenti che possono aiutarci a liberare tutto il nostro potenziale. Le migliori piattaforme alimentate da LLM ruoteranno attorno ad ambienti collaborativi in ​​cui gli esseri umani e l’intelligenza artificiale possono lavorare insieme. Insieme, possiamo ottenere più di quanto avremmo mai pensato possibile.

Di Shyamal Hitesh Anadkat lavora nell’IA applicata presso OpenAI .

Di ihal