Bard è la risposta di Google al popolarissimo sistema ChatGPT di OpenAI, che è diventata rapidamente l’app in più rapida crescita nella storia. Da quando ChatGPT è stato lanciato alla fine dello scorso anno, OpenAI ha continuamente migliorato il sistema: il loro aggiornamento GPT-4 della scorsa settimana è stato un grande passo avanti in termini di capacità del sistema.
Google, ovviamente, non vuole essere lasciato in asso. Ciò è particolarmente vero dal momento che il loro principale concorrente nello spazio di ricerca, Bing di Microsoft, include già funzionalità AI guidate da GPT-4. Detestando lasciare che un’altra gigantesca azienda mangi la torta del loro motore di ricerca altamente redditizio, Google sta ora lanciando Bard nel tentativo di competere.
Allora, che aspetto ha Bard? In cosa è bravo e dove fa fatica? E ucciderà ChatGPT?
L’interfaccia. Come molti prodotti Google, l’interfaccia di Bard è pulita e ordinata. C’è una finestra di testo, un posto dove inserire i prompt e non molto altro. In particolare, non sembra esserci una scheda della cronologia chat, come si ottiene con ChatGPT. Ciò significa che non puoi facilmente tornare indietro e recuperare le tue vecchie conversazioni di Bard. Queste conversazioni sono apparentemente più effimere. Nel complesso, l’interfaccia di Bard è semplice e intuitiva. Mentre l’interfaccia ChatGPT è più funzionale e professionale, Bard sembra più uno strumento orientato alle persone che arrivano su Google aspettandosi di eseguire una ricerca. Questo è probabilmente indicativo del fatto che OpenAI non si aspettava che ChatGPT fosse una tale rivelazione. Con la raffica di entusiasmo intorno a ChatGPT, non hanno intenzione di dedicare tempo prezioso all’aggiornamento dell’interfaccia utente. Al contrario, Google sembra aver costruito l’interfaccia utente un po’ più lentamente e deliberatamente.
Velocità. Bard è veloce. Per testarne la velocità, si è chiesto al sistema di “scrivere 500 parole su Bichon Frises”. Ha risposto in 9,5 secondi con una grossa fetta di testo. Il testo è in realtà di 329 parole (i modelli linguistici di grandi dimensioni non sono eccezionali nel conteggio), ma meno di 10 secondi è un tempo di risposta fulmineo. Bard fornisce anche le sue risposte tutte in una volta, mentre ChatGPT le digita come se fosse una persona che scrive in un elaboratore di testi. Ho dato la stessa richiesta a ChatGPT Plus, eseguendo GPT-4. Ci sono voluti 3 minuti e 2 secondi per rispondere con 428 parole. In breve, Bard è molto più veloce. Ecco le rispettive tariffe di parole al minuto, in base ai miei test:
- ChatGPT: 141 parole al minuto
- Bardo: 2.192 parole al minuto
Questa è una differenza enorme. Tuttavia, non è chiaro se questo vantaggio durerà. Bard è disponibile solo per una manciata di beta tester, mentre ChatGPT viene utilizzato continuamente da un massimo di 100 milioni di persone in tutto il mondo. Questo è un carico del server molto diverso da gestire. Una volta che Bard avrà più utenti, dovremo vedere se mantiene il suo vantaggio in termini di velocità. Per ora, però, Bard è molto più veloce di ChatGPT.
Capacità. Finora, sembra che Bard stia vincendo: è sia più bello che più veloce. Ma quando entri nel contenuto effettivo che genera, le prestazioni del sistema si degradano rapidamente. L’interfaccia di Bard è disseminata di dichiarazioni di non responsabilità sulle sue capacità. Google è molto chiaro sul fatto che “alcune delle risposte potrebbero essere imprecise” e anche che Bard ha barriere sostanziali. Questi includono:
- L’incapacità di scrivere codice. Google dice “Bard non può ancora aiutarti con la programmazione. Bard sta ancora imparando a programmare e per ora le risposte sul codice non sono ufficialmente supportate.
- Controlli di sicurezza integrati che impediscono risposte dannose o pericolose
- Limitazioni che sembrano indurre Bard a rifiutarsi di scrivere una risposta, piuttosto che scrivere una risposta che potrebbe essere errata o al di là delle sue capacità.
Considerando che ChatGPT generalmente tenterà di fare quasi tutto ciò che gli chiedi – e spesso ci riuscirà – Bard è molto più a suo agio nel dire “No” o semplicemente nel dirti che qualcosa va oltre le sue capacità. Ma il rovescio della medaglia è che si rifiuta anche di svolgere una serie di attività che sono un gioco da ragazzi per ChatGPT. Ad esempio, l’esperto ha chiesto di rispondere a un’e-mail di vendita che ha ricevuto, utilizzando la sua voce. Bard ha semplicemente rifiutato. ChatGPT ha obbligato con un messaggio personalizzato che parlava delle esigenze di scrittore: posso capire il rifiuto di dare istruzioni per costruire una bomba o qualcosa di altrettanto nefasto. Ma rifiutarsi di scrivere una risposta a un’e-mail? O Bard è seriamente privo di capacità che hanno altri LLM o Google ha sostanzialmente tarpato le ali nella sua prima fase di test.
Test del mondo reale: scrivere un post sul blog. Chiedere a Bard di scrivere un post sul blog ha prodotto risultati simili. Nello specifico, ho chiesto a Bard di scrivere un post in risposta alla domanda “I Bichon Frises sono ipoallergenici?”. Ha risposto quasi istantaneamente con gli ornamenti di un post. Ma le informazioni erano blande e generiche. Nominalmente, la sua risposta consisteva in parole, ma non c’era molto in termini di organizzazione, flusso o informazioni veramente utili. La risposta sembrava più un riepilogo dei dati estratti dalle prime pagine di Google, piuttosto che qualcosa di originale e utile. Ha anche iniziato a divagare con generalità sui Bichon. ChatGPT, d’altra parte, ha risposto con un post che aveva una chiara introduzione, struttura narrativa e conclusione. È stato davvero utile e qualcosa che si sarebbe letto davvero. Anche il post di ChatGPT si adatta molto meglio all’intento della mia domanda. E Bard è inciampato ulteriormente quando gli è stati chiesto di apportare alcuni aggiornamenti al post, includendo collegamenti ad articoli pertinenti e trasformando i titoli in tag H2. Il sistema ha semplicemente rifiutato, mentre ChatGPT ha svolto queste attività in modo allegro e accurato.
Test del mondo reale: risposta a una query di stile di ricerca. Per il prossimo test, si è deciso di provare a chiedere a Bard una query in stile ricerca. Google domina lo spazio di ricerca, quindi avrebbe dovuto fare meglio del suo concorrente qui. Per testare le sue capacità di ricerca, è stato chiesto a Bard il suggerimento: “Quali sono alcune cose divertenti da fare a Walnut Creek, in California?”. Bard ha risposto con un elenco puntato. Ancora una volta, le informazioni erano nominalmente accurate (includevano generalità sulle attività di Walnut Creek), ma a un esame più attento, molte cose non andavano. Ad esempio, Bard ha consigliato di fare un “giro in bicicletta attraverso la Lindsay Wildlife Experience”. Lindsay Wildlife è un museo al coperto e di certo non apprezzerebbero che si andasse in bici da quelle part.! Contrariamente alle risposte di ChatGPT, la risposta di Bard era molto più generica. Mentre Bard ha detto: “Visita il Ruth Bancroft Garden, un bellissimo giardino botanico con una varietà di piante provenienti da tutto il mondo”, ChatGPT ha scritto: “The Ruth Bancroft Garden: un bellissimo e unico giardino di 3 acri che mostra una variegata collezione di piante grasse, cactus e piante resistenti alla siccità provenienti da tutto il mondo, è assolutamente da vedere per gli appassionati di piante e i fotografi”. La seconda risposta è molto più specifica e interessante. Cattura l’unicità di questa attrazione (il giardino è dedicato alle piante autoctone resistenti alla siccità ed è un popolare punto fotografico) invece di chiamare semplicemente il giardino “bello” e dire che ha “una varietà di piante”. Sorprendentemente, ChatGPT ha fatto un lavoro migliore nel rispondere, anche con domande esplicitamente orientate alla ricerca.
Bard mostra del potenziale, ma attualmente è molto indietro rispetto a ChatGPT in termini di capacità complessive. Bard oggi sembra che sia dove si trovava ChatGPT a partire da GPT-3. Genera un testo in qualche modo accurato e specifico per la query, ma non soddisfa la sua comprensione dell’intento e della conoscenza umana. Bard sembra anche molto più conservatore e attento alla sicurezza di ChatGPT, anche nella sua prima iterazione. ChatGPT è sempre stato felice di provare a dare una risposta, mentre Bard è molto più a suo agio nel dire “no”.
Ciò riflette probabilmente i principi di innovazione dell’intelligenza artificiale di Google, che enfatizzano la sicurezza e l’eccellenza scientifica sopra ogni altra cosa. Forse applicare quell’alto livello di rigore fa bene alla società, ma rende lo strumento stesso molto meno utile per le persone che stanno cercando di migliorare la propria produttività. Nel complesso, sembra chiaro che Bard non stia tentando di competere con ChatGPT come strumento per applicazioni generiche. ChatGPT può fare quasi tutto, dalla composizione di poesie alla scrittura di software, alla riformattazione dei dati. Bard ritiene che sia molto più adatto a un compito specifico: la ricerca. Anche se ora fallisce in quel compito, con più dati di addestramento e più tempo, le sue risposte miglioreranno quasi sicuramente.
E una volta fatto, Bard avrà diversi vantaggi nello spazio di ricerca:
- I suoi tempi di risposta rapidi, supponendo che rimangano anche una volta che il sistema viene utilizzato su larga scala, sono più compatibili con una ricerca o una risposta a query vocali. Aspettare 10 secondi per i risultati di una query di ricerca AI va bene; aspettare più di 3 minuti è fuori questione. La velocità di Bard sembra adattata alla risposta alle richieste di ricerca.
- Bard non sembra essere costruito per svolgere compiti generali. Il più delle volte, semplicemente alza le mani virtuali e dice “Scusa, non posso farlo”. Ciò suggerisce che non intende essere uno strumento generale di miglioramento della produttività come ChatGPT. Google potrebbe essere focalizzato al laser sul caso d’uso della ricerca e quindi sta deliberatamente evitando di dedicare tempo all’espansione delle capacità di Bard in altre aree.
- La sua interfaccia è pulita e facile da usare. Posso vederlo facilmente integrato nel motore di ricerca di Google come un’altra scheda, insieme a cose come Immagini e Scholar.
In breve, i primi test suggeriscono che Google non sta cercando di competere con OpenAI nella costruzione di un modello multiuso. Sembrano concentrati sulla costruzione di un’intelligenza artificiale generativa nella loro attività di ricerca esistente e altamente redditizia. Bard è fortemente limitato nelle sue capacità in questo momento, ma gli ultimi mesi hanno dimostrato che i modelli di intelligenza artificiale generativa possono migliorare molto rapidamente. Man mano che Bard migliora, quasi sicuramente genererà risposte più complete e utili. E se Google impiega tutto il suo tempo per integrare quelle risposte nel suo motore di ricerca, ha buone possibilità di dominare quello spazio.