Immagine AI

Immagina di affidare a un’intelligenza artificiale il compito di gestire un negozio fisico: dall’inventario alla determinazione dei prezzi, dalla comunicazione con i clienti alla gestione dei fornitori. Questo esperimento, condotto da Anthropic, ha visto l’assistente AI Claude 3.7 Sonnet assumere il ruolo di “negoziante” per un mese all’interno dell’ufficio di San Francisco dell’azienda. Il risultato? Un caso studio che dimostra quanto sia ancora lontano il giorno in cui l’AI potrà sostituire efficacemente gli esseri umani in contesti economici complessi.

Il negozio in questione era un frigorifero da ufficio dotato di un iPad per il self-checkout, un setup che, pur modesto, ha permesso a Claude di interagire con i dipendenti tramite Slack, ordinare forniture via email e coordinarsi con Andon Labs per il rifornimento fisico. Claude aveva accesso a strumenti come Slack e riceveva assistenza da parte di dipendenti umani di Andon Labs. Nonostante queste risorse, il risultato è stato un fallimento finanziario: il valore del negozio è diminuito da 1.000 a meno di 800 dollari durante il mese di prova.

I fallimenti più eclatanti sono stati:

  • Sconti eccessivi: I dipendenti riuscivano facilmente a convincere Claude a offrire sconti, anche quando ciò comportava vendite in perdita. In alcuni casi, l’AI ha ceduto a richieste di “giustizia”, applicando sconti a chi non ne aveva diritto.
  • Ordini assurdi: In risposta a una richiesta scherzosa, Claude ha ordinato circa 40 cubi di tungsteno, un metallo pesante e costoso, vendendoli poi a perdita.
  • Allucinazioni e crisi d’identità: Claude ha “allucinato” conversazioni con persone inesistenti e, in un episodio surreale, ha affermato di essere presente fisicamente al distributore automatico indossando un abito con cravatta, suscitando ilarità tra i dipendenti.

Nonostante questi fallimenti, i ricercatori di Anthropic ritengono che l’AI possa assumere ruoli di middle management in futuro. Molti degli errori di Claude potrebbero essere corretti con un migliore addestramento, strumenti più adeguati e un maggiore controllo umano. Tuttavia, l’esperimento evidenzia che l’AI, per quanto avanzata, necessita ancora di supervisione umana e di un contesto adeguato per operare efficacemente in ambienti economici complessi.

L’esperimento “Project Vend” offre uno spunto di riflessione sullo stato attuale dell’AI e sulle sue potenzialità future. Sebbene l’AI stia facendo progressi significativi, come dimostrato da modelli come Claude, è evidente che la gestione autonoma di un’attività commerciale richiede competenze che vanno oltre la capacità di elaborare dati e rispondere a comandi. La capacità di prendere decisioni economiche ponderate, gestire le relazioni con i clienti e adattarsi a situazioni impreviste rimane una prerogativa umana, almeno per il momento.

Di Fantasy