L’adozione diffusa dell’intelligenza artificiale generativa è rallentata dalle preoccupazioni sulla precisione e la sicurezza dei modelli linguistici di grandi dimensioni (LLM). In risposta, la startup Patronus AI ha raccolto 17 milioni di dollari in finanziamenti di serie A per sviluppare un sistema che rileva automaticamente errori costosi e pericolosi nei modelli LLM su larga scala.
Il round di finanziamento, guidato da Glenn Solomon di Notable Capital e con la partecipazione di Lightspeed Venture Partners e altri, porta il totale del finanziamento di Patronus AI a 20 milioni di dollari. Fondata da Anand Kannappan e Rebecca Qian, ex esperti di machine learning di Meta, Patronus AI ha creato una piattaforma di valutazione automatizzata che individua errori come allucinazioni, violazioni del copyright e rischi per la sicurezza nei modelli LLM.
Utilizzando l’intelligenza artificiale proprietaria, Patronus AI valuta le prestazioni dei modelli, li sottopone a stress test con esempi contrastanti e consente benchmark dettagliati, tutto senza lo sforzo manuale richiesto dalla maggior parte delle aziende oggi.
Il CEO di Patronus AI, Anand Kannappan, ha spiegato che il loro prodotto è in grado di individuare errori come allucinazioni, violazioni del copyright e rischi per la sicurezza, oltre a fornire valutazioni dettagliate sullo stile e il tono dei testi generati.
Con l’emergere di potenti LLM come GPT-4o di OpenAI e Llama 3 di Meta, cresce la necessità di garantire l’integrità e l’accuratezza dei modelli generati. Patronus AI sostiene che le carenze dei modelli LLM possono avere conseguenze significative, come errori in articoli di notizie generati dall’intelligenza artificiale e problemi di sicurezza derivanti da risposte inesatte.
Patronus AI si distingue per il suo approccio incentrato sulla ricerca e la tecnologia avanzata. La piattaforma utilizza modelli di valutazione dedicati che evidenziano casi limite in cui è probabile che un modello LLM fallisca. La startup ha già attirato l’attenzione di aziende Fortune 500 in vari settori, tra cui automotive, istruzione, finanza e software.
Con ulteriori finanziamenti, Patronus AI mira a espandere i propri team di ricerca, ingegneria e vendita, sviluppando al contempo nuovi parametri di riferimento per il settore.
Patronus AI mira a diventare un punto di riferimento per la valutazione automatizzata degli LLM, rendendo più sicura e responsabile l’implementazione di questa tecnologia in una vasta gamma di settori. Anand Kannappan vede un futuro in cui il testing degli LLM con Patronus diventerà una pratica comune, simile alla validazione del codice di test unitario.
Tuttavia, la sfida rimane nell’affrontare la vastità dei possibili risultati generati dai modelli LLM. Con un approccio basato sulla ricerca, Patronus AI si impegna a individuare e risolvere errori in modo affidabile e scalabile, aprendo la strada a un uso più sicuro e responsabile dell’intelligenza artificiale generativa.