Durante l’evento re:Invent, Amazon Web Services (AWS) ha annunciato significativi aggiornamenti per Amazon Bedrock, la sua piattaforma di intelligenza artificiale generativa. Queste novità mirano a migliorare la personalizzazione e l’accuratezza dei modelli AI, rispondendo alle crescenti esigenze delle aziende.
Una delle principali innovazioni è l’introduzione della Distillazione dei Modelli. Questa tecnica consente di utilizzare un modello AI di grandi dimensioni per addestrare un modello più piccolo, mantenendo gran parte delle conoscenze del primo ma con tempi di risposta più rapidi. Questo approccio è particolarmente utile per le aziende che necessitano di soluzioni efficienti in termini di prestazioni senza compromettere la qualità delle risposte. Attualmente, la distillazione dei modelli è disponibile in anteprima e supporta modelli di Anthropic, Amazon e Meta.
Parallelamente, AWS ha implementato controlli di Verifica Automatica del Ragionamento per identificare e mitigare le allucinazioni nei modelli AI. Le allucinazioni, ovvero risposte generate dai modelli che non sono basate su dati reali o pertinenti, rappresentano una sfida significativa nell’adozione dell’intelligenza artificiale. Questi nuovi controlli, noti come controlli contestuali di base, permettono di rilevare e filtrare risposte che sono fattualmente inesatte rispetto a una fonte di riferimento o irrilevanti per la query dell’utente. I clienti possono configurare soglie di affidabilità per filtrare le risposte con bassa affidabilità di fondamento o rilevanza, migliorando così la qualità e l’affidabilità delle applicazioni AI.
Inoltre, AWS ha introdotto l’API ApplyGuardrail, che consente di applicare misure di protezione standardizzate per tutte le applicazioni di intelligenza artificiale generativa, indipendentemente dal modello di fondazione utilizzato. Questo permette alle aziende di implementare salvaguardie coerenti, anche quando utilizzano modelli personalizzati o di terze parti al di fuori di Amazon Bedrock, garantendo una governance centralizzata e una maggiore sicurezza nelle applicazioni AI.