TensorFlow Similarity di Google aiuta i modelli di intelligenza artificiale a trovare elementi correlati
Google ha annunciato oggi TensorFlow Similarity, un pacchetto Python progettato per addestrare modelli di similarità con il framework di machine learning TensorFlow dell’azienda. I modelli di somiglianza cercano elementi correlati, ad esempio trovando vestiti dall’aspetto simile e identificando le canzoni attualmente in riproduzione.
Come spiega Google, molti modelli di somiglianza vengono addestrati utilizzando una tecnica chiamata apprendimento contrastivo. L’apprendimento contrastivo, a sua volta, si basa su algoritmi di clustering, che identificano automaticamente i modelli nei dati operando sulla teoria che i punti dati nei gruppi dovrebbero avere caratteristiche simili.
L’apprendimento contrastivo consente a un modello di proiettare elementi in uno “spazio di incorporamento” quando applicato a un set di dati, in modo tale che le distanze tra gli incorporamenti – rappresentazioni matematiche degli elementi – siano indicative di quanto siano simili gli esempi di input. L’addestramento con TensorFlow Similarity produce uno spazio in cui la distanza tra elementi simili rimane piccola mentre la distanza tra elementi dissimili è grande. Ad esempio, l’addestramento di un modello di somiglianza sul set di dati Oxford-IIIT Pet porta a cluster in cui le razze dall’aspetto simile sono vicine e cani e gatti sono separati.
Modelli di similarità di addestramento
Una volta addestrato un modello, TensorFlow Similarity crea un indice che contiene gli incorporamenti dei vari elementi per renderli ricercabili. Secondo Google, la libreria consente ricerche su milioni di elementi indicizzati, recuperando le migliori corrispondenze simili in una frazione di secondo. Inoltre, TensorFlow Similarity può aggiungere un nuovo numero illimitato di classi all’indice senza dover riaddestrare, calcolando invece solo gli incorporamenti per gli elementi rappresentativi delle nuove classi.
Sebbene la versione iniziale della libreria sia focalizzata sulla fornitura di componenti per creare modelli di somiglianza basati sull’apprendimento contrastanti, Google afferma che in futuro aggiungerà il supporto per ulteriori tipi di modelli a TensorFlow Similarity. “La capacità di cercare elementi correlati ha molte applicazioni del mondo reale”, hanno scritto Elie Bursztein e Owen S. Vallis di Google in un post sul blog. “Più in generale, essere in grado di recuperare rapidamente elementi correlati è una parte vitale di molti sistemi informativi di base come ricerche multimediali, sistemi di raccomandazione e pipeline di clustering”.
TensorFlow Similarity è disponibile in open source tramite GitHub. Inoltre, Google ha rilasciato un notebook di programmazione con un tutorial sull’utilizzo di base.
Il rilascio di TensorFlow Similarity segue il lancio di altre estensioni TensorFlow focalizzate su particolari tipi di modelli e casi d’uso. Nel 2019, Google ha lanciato TensorFlow Privacy , una libreria destinata a semplificare agli sviluppatori l’addestramento di modelli di intelligenza artificiale con “forti garanzie di privacy”. E l’anno scorso, la società ha rilasciato un modulo sperimentale che testa la sicurezza dei modelli di intelligenza artificiale.