Immagine AI

Amazon Web Services (AWS) ha recentemente introdotto sul mercato una novità significativa nel campo dell’archiviazione ad alte prestazioni, con il lancio della disponibilità generale (GA) della sua classe di archiviazione S3 Express One Zone in combinazione con un motore vettoriale integrato. Questa mossa rappresenta un passo avanti cruciale per le aziende che gestiscono carichi di lavoro intensivi sui dati, in particolare quelli legati all’intelligenza artificiale (AI) e all’apprendimento automatico (ML), dove la latenza e i costi di elaborazione delle query vettoriali sono fattori critici.

La classe di archiviazione S3 Express One Zone è stata progettata specificamente per offrire la più bassa latenza e le massime prestazioni di archiviazione di oggetti nel cloud. A differenza della classe standard S3, che distribuisce i dati su più Zone di Disponibilità (AZ) per una maggiore resilienza, S3 Express One Zone memorizza i dati in una singola Zona di Disponibilità selezionata dall’utente. Questo design “mono-zona” permette una prossimità fisica estremamente ridotta tra l’archiviazione e le risorse di calcolo (come le istanze EC2), un fattore essenziale che si traduce in una riduzione significativa della latenza nell’accesso ai dati, fino a 10 volte più veloce rispetto a S3 Standard.

Per supportare tali prestazioni elevate, AWS ha introdotto i Directory Bucket, un nuovo tipo di bucket S3 ottimizzato per gestire centinaia di migliaia di richieste al secondo, in grado di scalare elasticamente in base al consumo senza la necessità di un pre-provisioning complesso. Questa combinazione di architettura a bassa latenza e alta velocità di richiesta è fondamentale per accelerare le applicazioni più esigenti, come quelle di analisi in tempo reale, media processing, o come nel caso specifico, l’elaborazione di vettori per i modelli di AI generativa.

Il vero punto di svolta, secondo AWS, risiede nell’integrazione di un motore vettoriale nativo all’interno di S3 Express One Zone. I dati vettoriali sono rappresentazioni numeriche (embedding) di dati complessi (come testo, immagini o audio) che catturano le loro relazioni semantiche, rendendoli la spina dorsale dei moderni sistemi di ricerca di somiglianza e AI generativa. Tradizionalmente, questi vettori vengono archiviati in database vettoriali specializzati.

AWS ha affermato che, utilizzando il motore vettoriale integrato in S3 Express One Zone, le aziende possono conseguire un risparmio sui costi che può arrivare fino al 90% rispetto all’utilizzo di soluzioni basate su database vettoriali esterni per i carichi di lavoro di archiviazione e recupero di vettori. Questo massiccio risparmio è possibile grazie a diversi fattori. Innanzitutto, l’architettura mono-zona riduce i costi di trasferimento dei dati e di inattività del calcolo, poiché i dati vengono elaborati molto più rapidamente. In secondo luogo, eliminando la necessità di un database vettoriale separato per l’archiviazione, si semplifica l’infrastruttura e si riducono i costi operativi associati alla gestione di un sistema di database aggiuntivo.

È importante sottolineare la strategia di AWS nel definire S3 Express One Zone come complementare piuttosto che come sostitutivo dei database vettoriali esistenti (come Amazon Aurora, Amazon OpenSearch Service, o soluzioni partner).

I database vettoriali dedicati offrono capacità avanzate e ottimizzazioni per la ricerca di somiglianza e la gestione di indici vettoriali complessi, risultando essenziali per le applicazioni che richiedono una ricerca estremamente sofisticata e ad alta velocità. Al contrario, S3 Express One Zone è l’ideale per i carichi di lavoro che necessitano di un’archiviazione vettoriale di base estremamente economica e veloce per il tiering dei dati meno caldi, per l’archiviazione di vettori di grandi dimensioni (ad esempio per l’addestramento di modelli), o per scenari in cui la velocità di accesso ai dati è prioritaria rispetto alla complessità delle query vettoriali. In sostanza, AWS offre agli utenti una nuova opzione di archiviazione che permette loro di ottimizzare i costi e le prestazioni scegliendo lo strumento più adatto a seconda della specifica fase del ciclo di vita del dato vettoriale e del requisito applicativo.

Di Fantasy