Immagine AI

L’uso di assistenti vocali basati su modelli linguistici di grandi dimensioni sta scivolando, spesso senza che ce ne accorgiamo, in un terreno che fino a pochi anni fa era esclusivo dei genitori, dei pediatri e dei nutrizionisti: quello delle scelte alimentari di bambini e adolescenti. La domanda banale “cosa mangio a pranzo?” rivolta a Gemini Live, a ChatGPT con voce o ad analoghe interfacce conversazionali non produce più una risposta generica da motore di ricerca, ma un piano dettagliato, parlato con tono amichevole e umanissimo, calibrato sui pochi dati che l’utente, spesso un minore, fornisce in modo informale durante la conversazione. È un cambio di paradigma rilevante, perché sposta il consiglio nutrizionale da un contesto deliberato e mediato (cercare, leggere, confrontare) a un contesto ambientale e immediato, in cui la voce sintetica funge da figura di riferimento conversazionale.

Il problema tecnico di fondo è che i modelli generalisti non sono stati ottimizzati né validati per la pianificazione dietetica pediatrica. Una recente ricerca dell’Università Atlas di Istanbul ha messo a confronto i piani alimentari prodotti da ChatGPT 4, Gemini 2.5 Pro, Bing/Copilot, Claude 4.1 e Perplexity con quelli redatti da dietisti registrati, partendo dagli stessi parametri di età, altezza e peso e chiedendo tre giorni di pasti con due spuntini. Il dato che emerge è sistematico più che aneddotico: i modelli sottostimano in media il fabbisogno energetico totale di circa settecento calorie al giorno e tendono a comprimere anche l’apporto di nutrienti chiave. In un adolescente in fase di crescita, una compressione di questa entità protratta nel tempo non è una semplice imprecisione nutrizionale, ma una potenziale interferenza con i processi di sviluppo osseo, ormonale e neurocognitivo, oltre che un rinforzo di pattern alimentari restrittivi che la letteratura clinica associa all’innesco di disturbi della condotta alimentare.

La spiegazione di questo bias verso la restrizione è plausibilmente da cercare nei dati di addestramento. I corpora su cui i modelli sono stati allenati riflettono in modo sproporzionato la cultura della dieta che domina il web anglofono (blog di dimagrimento, forum di fitness, contenuti di lifestyle improntati al deficit calorico) e questa distribuzione si traspone nelle risposte di default, in assenza di una richiesta esplicita di piani di mantenimento o di crescita. Il modello non “sa” che sta parlando con un dodicenne; produce ciò che statisticamente assomiglia di più a un “piano alimentare per perdere peso”, che è la formulazione più rappresentata nei dati. Il sistema RLHF e i guardrail di sicurezza, calibrati prevalentemente su rischi quali autolesionismo esplicito o contenuti illeciti, intercettano con difficoltà un consiglio nutrizionale che, preso singolarmente, suona ragionevole e privo di allarmi lessicali.

A questo livello tecnico si somma un secondo problema, più sottile e legato alla modalità vocale. L’interfaccia parlata abbassa drasticamente l’attrito cognitivo della conversazione: non c’è uno schermo con citazioni, fonti, link, disclaimer visibili in coda alla risposta. La voce sintetica, oggi indistinguibile da quella umana per cadenza, prosodia e gestione delle pause, viene processata dal cervello come una raccomandazione interpersonale, attivando meccanismi di fiducia che il testo scritto non attiva con la stessa intensità. Per un bambino, in particolare, l’assenza di un’autorità visiva concorrente — la confezione del cibo, l’etichetta nutrizionale, la presenza fisica del genitore — rende il consiglio dell’assistente la fonte dominante nel momento della decisione. È un’asimmetria che gli stessi produttori riconoscono solo parzialmente: l’age gating sui chatbot consumer rimane in larga misura dichiarativo, basato su una casella da spuntare, e diverse analisi indipendenti hanno mostrato che i modelli sono in grado di stimare l’età probabile dell’interlocutore dal contenuto della conversazione ma raramente modificano in modo significativo il proprio comportamento quando individuano un minore.

Sul piano della governance dei dati, la conversazione vocale su cibo, abitudini e corpo è una delle categorie più sensibili che un sistema possa raccogliere. Si tratta di informazioni che, combinate con i metadati di sessione, permettono di profilare con notevole precisione lo stato di salute, le preferenze e le vulnerabilità di un soggetto in formazione. Le tutele previste da normative come il COPPA negli Stati Uniti o il GDPR in Europa per i minori funzionano se l’operatore riconosce di stare trattando dati di un bambino; quando l’accesso avviene attraverso l’account di un genitore, su un dispositivo condiviso, o tramite un assistente integrato nello smart speaker di casa, quella distinzione si dissolve di fatto.

La direzione tecnica per mitigare questi rischi esiste ed è in parte già nota: pipeline di fine-tuning specifiche su linee guida pediatriche validate, classificatori a monte che riconoscano richieste di pianificazione dietetica per minori e instradino verso flussi vincolati o verso un rifiuto motivato, integrazione di soglie energetiche e di macronutrienti calibrate per fascia d’età, citazione obbligatoria della fonte clinica nella risposta vocale, e soprattutto un disaccoppiamento netto tra capacità conversazionale e capacità prescrittiva, in modo che il modello possa parlare di cibo in termini culturali, ricreativi o educativi senza scivolare automaticamente nella raccomandazione operativa. Nessuno di questi interventi è esotico dal punto di vista ingegneristico; tutti richiedono però una scelta deliberata di trattare la nutrizione infantile come dominio ad alto rischio al pari della consulenza medica o legale, e non come un sottoinsieme generico del “lifestyle assistant” che oggi rappresenta il posizionamento commerciale dominante.

Di Fantasy