Recentemente, è emerso che Google sta esplorando l’idea di sviluppare un chatbot specializzato che sfrutta l’intelligenza artificiale (AI) per analizzare dati e immagini conservati sugli smartphone al fine di narrare le storie di vita degli individui. Questo progetto rappresenta un tentativo di massimizzare le capacità di “Gemini”, l’ultimo modello linguistico di Google che può interpretare non solo testi, ma anche immagini e video.
Secondo quanto riportato da CNBC, citando documenti interni di Google, il giorno 8 si è tenuta una presentazione riguardante una proposta chiamata “Progetto Ellmann”. Questo progetto prende il nome dal noto biografo e critico letterario Richard David Elman e mira a creare una sorta di biografia digitale per ogni utente.
Attraverso la funzione multimodale di Gemini, il sistema raccoglie risultati di ricerca e fotografie da smartphone, Google Cloud e Internet, per poi creare un chatbot personalizzato (Elman Chat). Questo chatbot è in grado di rispondere a domande riguardanti specifici eventi passati e riassumere i momenti salienti della vita di una persona. È interessante notare che più di un miliardo di utenti hanno già caricato circa 4 trilioni di foto e video su Google Foto.
Il documento interno descrive come il sistema possa fornire una narrazione dettagliata di un evento, utilizzando le foto precedenti e successive a un determinato momento e integrando etichette fotografiche e informazioni sulla localizzazione. Ad esempio, il sistema potrebbe identificare una foto come il momento della nascita del primo figlio di una coppia, basandosi su una combinazione di conoscenze correlate.
Elman Chat può anche dedurre preferenze e interessi degli utenti, come i cibi preferiti, attraverso l’analisi delle foto di cibo e includere dettagli anche dalle immagini meno chiare.
Inoltre, analizzando gli screenshot dell’utente, Elman Chat può identificare prodotti considerati per l’acquisto, interessi personali, lavori, programmi di viaggio e molto altro, basandosi su documenti Google, pagine web visitate e utilizzo delle app.
Tuttavia, la realizzazione effettiva di questo progetto non è ancora stata confermata. Un portavoce di Google ha dichiarato: “Google Foto utilizza già l’intelligenza artificiale per aiutare le persone a scoprire foto e video. Siamo entusiasti del potenziale di LLM nel fornire esperienze ancora più ricche. Il progetto è ancora in fase iniziale, ma se dovesse essere lanciato, sarà progettato con la massima attenzione alla protezione dei dati personali e alla sicurezza degli utenti”.