Amazon ha deciso di interrompere KiroRank, un sistema interno utilizzato per monitorare e confrontare l’utilizzo degli strumenti di intelligenza artificiale da parte dei dipendenti. La decisione arriva dopo che il meccanismo di classificazione ha generato effetti indesiderati, incentivando in alcuni casi comportamenti orientati ad aumentare artificialmente il consumo di risorse AI anziché migliorare concretamente la produttività.
KiroRank era stato introdotto come strumento per promuovere l’adozione della piattaforma di sviluppo AI Kiro all’interno dell’organizzazione. Il sistema raccoglieva dati relativi all’utilizzo degli strumenti di intelligenza artificiale e produceva classifiche basate sui livelli di attività registrati dai singoli utenti. L’obiettivo iniziale era incoraggiare gli sviluppatori a familiarizzare con le nuove tecnologie e accelerarne l’integrazione nei flussi di lavoro quotidiani.
Con il passare del tempo, tuttavia, il sistema ha iniziato a produrre comportamenti che hanno ridotto l’efficacia della metrica stessa. Alcuni dipendenti hanno infatti iniziato a utilizzare gli agenti AI per attività marginali o non direttamente collegate al proprio lavoro, con l’obiettivo di incrementare il numero di operazioni registrate e migliorare il posizionamento nelle classifiche interne.
Il fenomeno è particolarmente significativo perché evidenzia una delle nuove problematiche introdotte dall’utilizzo estensivo degli agenti AI nelle aziende. A differenza dei tradizionali assistenti conversazionali, gli agenti autonomi possono eseguire attività complesse per lunghi periodi di tempo, generando grandi volumi di richieste e consumando quantità molto elevate di token computazionali. Quando il parametro di valutazione diventa il volume di utilizzo anziché il valore prodotto, il rischio è che l’infrastruttura venga utilizzata per massimizzare la metrica piuttosto che l’efficienza operativa.
Secondo quanto emerso internamente, l’incremento artificiale dell’attività AI ha contribuito a un aumento dei costi di elaborazione. Alcuni utenti avrebbero infatti delegato agli agenti attività prive di reale utilità operativa, sfruttando il sistema di classificazione per ottenere un vantaggio nelle graduatorie. Questo comportamento viene talvolta indicato nel settore tecnologico con il termine “tokenmaxxing”, una pratica che consiste nell’aumentare intenzionalmente il consumo di token per migliorare indicatori o statistiche legate all’utilizzo dell’intelligenza artificiale.
La vicenda assume particolare rilevanza perché Amazon è una delle aziende che stanno investendo maggiormente nell’adozione interna degli strumenti AI. L’organizzazione ha infatti introdotto diverse piattaforme destinate ad automatizzare attività di sviluppo software e processi operativi, tra cui gli ambienti Kiro e MeshClaw, utilizzati per supportare il lavoro degli ingegneri attraverso agenti intelligenti e sistemi di automazione avanzata.
All’interno dell’azienda è inoltre presente un forte orientamento verso l’adozione sistematica dell’intelligenza artificiale. Gli obiettivi fissati prevedono che una larga parte degli sviluppatori utilizzi strumenti AI in maniera continuativa durante il proprio lavoro. In questo contesto, la disponibilità di metriche accurate per valutare l’efficacia dell’adozione diventa un elemento strategico fondamentale.
La sospensione di KiroRank evidenzia infatti una trasformazione più ampia che sta interessando molte organizzazioni. Nella fase iniziale dell’introduzione dell’intelligenza artificiale, l’attenzione era spesso concentrata sull’incremento dell’utilizzo e sulla diffusione degli strumenti tra i dipendenti. Con la maturazione dei progetti AI, il focus si sta progressivamente spostando dalla quantità di utilizzo ai risultati concreti ottenuti.
Per questo motivo Amazon sta introducendo nuove modalità di valutazione. Tra queste figura la metrica denominata “Normalized Deployments”, progettata per misurare l’effettivo impatto del lavoro svolto attraverso l’intelligenza artificiale. Invece di considerare il numero di richieste inviate ai modelli o il volume di token consumati, il sistema valuta la capacità degli sviluppatori di produrre codice funzionante, implementazioni effettive e risultati utilizzabili all’interno dei prodotti aziendali.
Questo approccio riflette un cambiamento significativo nella gestione delle tecnologie AI in ambito enterprise. Con la crescita degli agenti autonomi e l’aumento dei costi associati all’elaborazione dei modelli avanzati, le aziende stanno iniziando a considerare il ritorno sull’investimento come indicatore principale del successo delle iniziative legate all’intelligenza artificiale.
La decisione di interrompere KiroRank rappresenta quindi un caso concreto di come le organizzazioni stiano adattando i propri sistemi di misurazione all’evoluzione dell’AI. Più che premiare il semplice utilizzo degli strumenti, l’obiettivo diventa verificare se l’intelligenza artificiale contribuisce realmente alla creazione di valore, all’accelerazione dello sviluppo software e al miglioramento delle attività operative.
