Oggi, Arcee AI ha introdotto SuperNova, un nuovo modello di linguaggio con 70 miliardi di parametri, progettato specificamente per le esigenze aziendali. Questo modello offre avanzate capacità di follow-up delle istruzioni e opzioni di personalizzazione, ponendosi come una valida alternativa ai servizi API di OpenAI e Anthropic. SuperNova affronta preoccupazioni chiave come la privacy dei dati, la stabilità del modello e la personalizzazione.
Le caratteristiche principali di SuperNova sono:
- Distribuzione Interna: A differenza dei modelli basati su cloud, SuperNova può essere installato e personalizzato direttamente all’interno dell’infrastruttura dell’azienda. È basato sull’architettura Llama-3.1-70B-Instruct di Meta e utilizza un innovativo processo di post-formazione che migliora l’aderenza alle istruzioni e l’adattabilità alle specifiche esigenze aziendali.
- Personalizzazione e Privacy: SuperNova viene distribuito nel Virtual Private Cloud (VPC) dell’azienda, garantendo che i dati sensibili rimangano sotto controllo dell’organizzazione. Questo approccio consente una personalizzazione approfondita senza rischiare cambiamenti imprevisti come quelli che possono avvenire con i servizi API esterni.
Lucas Atkins, ingegnere capo di Arcee, ha spiegato che SuperNova è stato addestrato utilizzando tre approcci diversi:
- Distillazione da un modello di 405 miliardi di parametri.
- Utilizzo di un set di dati generato con il loro strumento EvolKit.
- Applicazione di un metodo di Post-Training Optimization (DPO) aggiuntivo.
Questo processo ha prodotto un modello con capacità avanzate di follow-up delle istruzioni, mantenendo alcune delle competenze dei modelli più grandi ma rimanendo adattabile a hardware meno potente.
SuperNova sarà disponibile su AWS Marketplace, e Arcee prevede di offrirlo anche su Google e Azure Marketplace. Mark McQuade, co-fondatore di Arcee AI, ha sottolineato che il modello sarà distribuito con un server web, un’interfaccia di chat e un database per gestire la cronologia delle conversazioni, consentendo a tutta l’organizzazione di interagire con esso.
Una delle caratteristiche distintive di SuperNova è la possibilità di adattarlo continuamente alle preferenze aziendali. Il modello può essere riaddestrato all’interno dell’ambiente dell’azienda, migliorando costantemente in base alle interazioni e ai dati raccolti.
Anche se il modello completo non è open source, Arcee offre:
- Un’API gratuita per test e valutazione.
- SuperNova-Lite, una versione con 8 miliardi di parametri per ambienti con risorse limitate.
- EvolKit, uno strumento open source per generare dati di training personalizzati.
Arcee afferma che SuperNova eccelle particolarmente nel ragionamento matematico e sta incoraggiando valutazioni di terze parti per confermare queste affermazioni. Questo potrebbe essere particolarmente utile per settori come finanza e ricerca scientifica.
Il lancio di SuperNova rappresenta un possibile cambiamento nel panorama dell’IA aziendale. Mentre i servizi API basati su cloud hanno dominato finora, c’è un crescente interesse per modelli distribuibili che offrono maggiore controllo e personalizzazione.
SuperNova si distingue per:
- Riservatezza dei dati: garantisce che i dati rimangano sotto controllo aziendale.
- Stabilità del modello: offre un modello stabile che non cambia senza preavviso.
- Personalizzazione approfondita: consente riaddestramenti specifici per le esigenze aziendali.
- Controllo dei costi: potrebbe risultare più conveniente rispetto all’uso di API su larga scala.
La sfida sarà vedere se SuperNova riuscirà a combinare il controllo e la personalizzazione con le prestazioni di alto livello dei modelli basati su cloud. Questo modello potrebbe rappresentare una nuova direzione per l’IA aziendale, offrendo un equilibrio tra controllo interno e capacità avanzate.