Nel regno degli incantati LLM, l’ultima magia è stata compiuta da GPT-4, che ha salvato la vita di un cane rilevando una malattia attraverso i sintomi. Ora, gli scienziati stanno fondendo la saggezza animale con i segreti di LaMDA, abbracciando l’essenza di GPT-3. All’interno del progetto Earth Species (ESP), perseguono il Santo Graal: decodificare le lingue degli animali. La conoscenza del passato sta tessendo un arazzo, dando vita a una melodica “Rosetta Stone”, rivelando le sinfonie segrete delle creature.
Sebbene sembri naturale permettere agli algoritmi di NLP di trovare la struttura della comunicazione animale, il problema ha molte più sfaccettature. Una delle insidie più basilari è che i rumori sono solo una delle modalità che gli animali usano per comunicare. Gli stimoli visivi e tattili svolgono un ruolo altrettanto importante nella comunicazione animale quanto gli stimoli uditivi.
La comunicazione umana si basa su molte norme e strutture sociali, che servono come punto di riferimento quando si tratta di decodificare le lingue antiche. Tuttavia, la comunicazione animale non ha tale punto di riferimento, poiché ogni specie ha la propria sintassi di comunicazione.
La raccolta di dati sugli animali comporta anche una serie di problemi etici. La ricerca ha scoperto che anche se gli esperimenti non sono costruiti per essere manipolativi e sono puramente osservativi, gli scienziati intervengono comunque per monitorare. Ciò potrebbe causare angoscia agli animali che stanno studiando, avvelenando i dati e sollevando preoccupazioni etiche che gli scienziati devono ora valutare.
Oltre a decodificare la comunicazione stessa, anche dare un senso ai dati sugli animali è un’impresa colossale. A differenza dei dati umani, che sono annotati in modo intuitivo (per gli esseri umani), i dati sugli animali non solo sono difficili da procurarsi, ma necessitano anche di ricerche specifiche per essere annotati.
Questi sono solo alcuni dei problemi che i ricercatori devono affrontare quando osservano la comunicazione animale. In effetti, gli scienziati hanno cercato di decodificare la comunicazione animale sin dalla fine degli anni ’50, ottenendo un corpus completo di ricerche sull’argomento.
Basandosi su questa eredità, l’ESP mira a risolvere alcuni dei problemi di lunga data del settore attraverso l’uso dell’IA. Dalla mappatura delle voci dei corvi alla costruzione di un punto di riferimento dei suoni degli animali, ESP sta gettando le basi per la futura ricerca sull’IA nel campo. A tal fine, il progetto ha anche una tabella di marcia che descrive in dettaglio come desiderano utilizzare l’intelligenza artificiale per ridurre il divario di comunicazione tra le specie.
Secondo ESP, ci sono 4 aspetti principali del problema della comunicazione: dati, fondamenti, decodifica e comunicazione. Il progetto mira a fornire soluzioni AI per ciascuno di questi sottoproblemi. Per i dati, sta costruendo modelli autocontrollati per annotare e interpretare i dati raccolti, tra le altre attività. Sul lato fondamentale, si concentra sulla costruzione di modelli fondamentali, come il modello AVES (codifica della vocalizzazione animale basata sull’auto-supervisione).
Per la decodifica, ESP sta costruendo modelli di rilevamento di pattern auto-supervisionati. Infine, per la comunicazione, sta creando una soluzione di intelligenza artificiale generativa con l’aiuto di Google per generare i segnali comunicativi degli animali. A tal fine, uno dei loro progetti più interessanti attualmente è l’esperimento di vocalizzazione generativa, che si aggiunge all’arsenale dei ricercatori di strumenti di ricerca sulla bioacustica. Usando questo approccio, i ricercatori possono riprodurre vocalizzazioni modificate, approfondendo così la loro comprensione della comunicazione animale.
Usando l’intelligenza artificiale, l’ESP è stato in grado di trasformare le relazioni semantiche in relazioni geometriche, lo stesso processo utilizzato in passato per rendere più efficienti gli algoritmi di NLP. Visualizzando le relazioni tra le varie parole, diventa possibile creare una forma per una data lingua. Questo è stato implementato con successo per le lingue umane, ma ESP ritiene di poter andare oltre. Aza Raskin, uno dei co-fondatori del progetto Earth Species, ha dichiarato: