Per le aziende che cercano di implementare modelli di intelligenza artificiale nelle proprie operazioni, una delle domande più critiche è la sicurezza dell’implementazione del modello scelto.
La piattaforma AI Quality di Kolena, una startup con sede a San Francisco fondata da un ex senior engineering manager di Amazon, Mohamed Elgendy, è stata annunciata oggi in una vasta scala. Questa applicazione web è progettata per consentire test e validazioni rapide e accurate dei sistemi di intelligenza artificiale, compresi il monitoraggio della qualità dei dati, i test dei modelli e il monitoraggio della deriva dei dati e del degrado dei modelli nel tempo. Offre inoltre funzionalità di debug.
Elgendy, CEO di Kolena, ha sottolineato che la soluzione è stata progettata per supportare gli sviluppatori di software e il personale IT nella creazione di sistemi di intelligenza artificiale sicuri, affidabili ed equi per casi d’uso reali. La piattaforma consente il rapido sviluppo di casi di test dettagliati da set di dati, facilitando l’attento esame dei modelli AI/ML negli scenari reali.
Ogni cliente di Kolena può collegare il modello desiderato alla propria API e fornire il set di dati del cliente insieme a una serie di requisiti funzionali su come desidera che il modello funzioni una volta distribuito. Kolena eseguirà quindi test sul modello per verificare se produce risultati indesiderati.
Elgendy ha sottolineato l’importanza di testare i sistemi di intelligenza artificiale, sia per le aziende che per le aziende fornitori di modelli AI. Ha notato che modelli come Gemini di Google avrebbero potuto trarre vantaggio dai test di Kolena prima dell’implementazione, evidenziando l’importanza di garantire la sicurezza e l’affidabilità dei modelli AI.
La piattaforma di Kolena è stata offerta in versione beta chiusa ai clienti negli ultimi 24 mesi e ha già eseguito “decine di migliaia” di test su modelli di intelligenza artificiale. Kolena offre la sua piattaforma di qualità AI con un prezzo basato su un modello SaaS, con tre livelli di prezzi progettati per monitorare la crescita di un’azienda con l’intelligenza artificiale, dall’esame della qualità dei dati all’addestramento di un modello e alla sua distribuzione.