Patronus AI ha recentemente lanciato Judge-Image, il primo modello di linguaggio multimodale su larga scala progettato per valutare i sistemi di intelligenza artificiale che interpretano immagini e generano testo. Questo strumento mira a identificare e mitigare fenomeni come le “allucinazioni” dell’AI e problemi di affidabilità nelle applicazioni multimodali. Un esempio significativo dell’adozione di questa tecnologia è rappresentato da Etsy, il colosso dell’e-commerce specializzato in prodotti artigianali e vintage, che utilizza Judge-Image per verificare l’accuratezza delle didascalie delle immagini dei prodotti nel suo vasto marketplace.
Anand Kannappan, cofondatore di Patronus AI, ha espresso entusiasmo riguardo alla collaborazione con Etsy, sottolineando l’importanza di garantire che le didascalie generate automaticamente siano corrette, dato l’enorme numero di articoli presenti sulla piattaforma.
Per lo sviluppo di Judge-Image, Patronus ha scelto di basarsi sul modello Gemini di Google, dopo aver condotto ricerche comparative con alternative come GPT-4V di OpenAI. Kannappan ha spiegato che Gemini ha mostrato una minore propensione a bias egocentrici, offrendo un approccio più equo nella valutazione di diversi tipi di input e output.
Judge-Image offre valutatori pronti all’uso che analizzano le didascalie delle immagini secondo vari criteri, tra cui la rilevazione di allucinazioni, il riconoscimento di oggetti primari e secondari, l’accuratezza della posizione degli oggetti e l’analisi del testo presente nelle immagini.
Oltre al settore del commercio elettronico, le applicazioni di Judge-Image si estendono a team di marketing e studi legali. Ad esempio, i team di marketing possono utilizzarlo per creare in modo scalabile descrizioni e didascalie per nuovi design, mentre le grandi imprese, come le società di servizi finanziari e gli studi legali, possono impiegarlo per estrarre informazioni da documenti PDF e riassumere contenuti di documenti estesi.
Patronus AI offre diversi livelli di prezzo per Judge-Image, a partire da un’opzione gratuita che consente agli utenti di sperimentare la piattaforma fino a determinati limiti di volume. Superata questa soglia, i clienti possono pagare in base all’utilizzo o optare per accordi aziendali personalizzati. Sebbene Judge-Image sia basato sul modello Gemini di Google, Patronus si considera complementare, piuttosto che in competizione, con fornitori di modelli fondamentali come Google, OpenAI e Anthropic.