Immagine AI

Google ha modificato il funzionamento dei limiti di utilizzo di Gemini introducendo un sistema di gestione delle quote completamente diverso rispetto al passato. Il chatbot AI non utilizzerà più un semplice conteggio del numero di messaggi inviati dagli utenti, ma adotterà un modello “compute-based”, cioè basato sulle risorse di calcolo effettivamente consumate durante ogni interazione.

Il cambiamento riguarda direttamente il modo in cui vengono misurati i consumi all’interno della piattaforma. Con il nuovo sistema non tutte le richieste avranno lo stesso peso: le operazioni leggere consumeranno una quantità ridotta di quota disponibile, mentre attività più complesse richiederanno una maggiore capacità computazionale e incideranno in modo più significativo sui limiti assegnati all’utente.

Secondo la documentazione aggiornata di Google, il nuovo algoritmo tiene conto di diversi parametri contemporaneamente. Tra gli elementi considerati ci sono la complessità del prompt inviato, il modello linguistico utilizzato, la lunghezza della conversazione e le funzionalità AI attivate durante la sessione. Anche la cronologia della chat diventa un fattore rilevante, perché i modelli devono continuamente rileggere e processare i contenuti precedenti accumulando token e aumentando il carico computazionale necessario per generare la risposta.

Le funzioni avanzate di Gemini risultano tra quelle con il maggiore impatto sui nuovi limiti. Strumenti come Deep Research, l’analisi di file complessi, l’elaborazione multimodale e le funzioni AI dedicate alla generazione video o all’interpretazione di grandi quantità di dati richiedono infatti una potenza di elaborazione superiore rispetto alle normali conversazioni testuali. Di conseguenza gli utenti che utilizzano frequentemente queste funzioni potrebbero raggiungere più rapidamente la soglia massima disponibile.

Google ha inoltre introdotto un sistema di aggiornamento dinamico delle quote attraverso una finestra mobile di cinque ore. Il limite non viene quindi azzerato una sola volta al giorno, ma si aggiorna progressivamente nel tempo in base all’utilizzo recente della piattaforma. Rimane comunque presente una soglia settimanale massima collegata al tipo di account e al piano sottoscritto dall’utente.

La modifica si inserisce nell’espansione dell’ecosistema Gemini annunciata durante il Google I/O 2026, evento nel quale l’azienda ha presentato nuovi modelli AI, funzioni multimodali avanzate e strumenti dedicati alla produttività e alla ricerca automatizzata. Con l’aumento della complessità delle operazioni eseguite dai modelli linguistici, Google punta a distribuire in modo più efficiente le risorse dei server, superando il precedente sistema basato esclusivamente sul numero di messaggi inviati.

Il nuovo approccio riflette anche l’evoluzione generale delle piattaforme di intelligenza artificiale generativa, che stanno progressivamente spostando la gestione dei limiti verso modelli basati sul consumo reale di token, memoria e potenza computazionale. In questo scenario le richieste più elaborate, le sessioni lunghe e le funzionalità multimodali diventano elementi centrali nella definizione delle quote di utilizzo, trasformando il rapporto tra utenti, modelli AI e infrastrutture cloud necessarie al loro funzionamento.

Di Fantasy