Oggi, Arcee AI ha introdotto SuperNova, un nuovo modello di linguaggio con 70 miliardi di parametri, progettato specificamente per le esigenze aziendali. Questo modello offre avanzate capacità di follow-up delle istruzioni e opzioni di personalizzazione, ponendosi come una valida alternativa ai servizi API di OpenAI e Anthropic. SuperNova affronta preoccupazioni chiave come la privacy dei dati, la stabilità del modello e la personalizzazione.

Le caratteristiche principali di SuperNova sono:

  • Distribuzione Interna: A differenza dei modelli basati su cloud, SuperNova può essere installato e personalizzato direttamente all’interno dell’infrastruttura dell’azienda. È basato sull’architettura Llama-3.1-70B-Instruct di Meta e utilizza un innovativo processo di post-formazione che migliora l’aderenza alle istruzioni e l’adattabilità alle specifiche esigenze aziendali.
  • Personalizzazione e Privacy: SuperNova viene distribuito nel Virtual Private Cloud (VPC) dell’azienda, garantendo che i dati sensibili rimangano sotto controllo dell’organizzazione. Questo approccio consente una personalizzazione approfondita senza rischiare cambiamenti imprevisti come quelli che possono avvenire con i servizi API esterni.

Lucas Atkins, ingegnere capo di Arcee, ha spiegato che SuperNova è stato addestrato utilizzando tre approcci diversi:

  1. Distillazione da un modello di 405 miliardi di parametri.
  2. Utilizzo di un set di dati generato con il loro strumento EvolKit.
  3. Applicazione di un metodo di Post-Training Optimization (DPO) aggiuntivo.

Questo processo ha prodotto un modello con capacità avanzate di follow-up delle istruzioni, mantenendo alcune delle competenze dei modelli più grandi ma rimanendo adattabile a hardware meno potente.

SuperNova sarà disponibile su AWS Marketplace, e Arcee prevede di offrirlo anche su Google e Azure Marketplace. Mark McQuade, co-fondatore di Arcee AI, ha sottolineato che il modello sarà distribuito con un server web, un’interfaccia di chat e un database per gestire la cronologia delle conversazioni, consentendo a tutta l’organizzazione di interagire con esso.

Una delle caratteristiche distintive di SuperNova è la possibilità di adattarlo continuamente alle preferenze aziendali. Il modello può essere riaddestrato all’interno dell’ambiente dell’azienda, migliorando costantemente in base alle interazioni e ai dati raccolti.

Anche se il modello completo non è open source, Arcee offre:

  • Un’API gratuita per test e valutazione.
  • SuperNova-Lite, una versione con 8 miliardi di parametri per ambienti con risorse limitate.
  • EvolKit, uno strumento open source per generare dati di training personalizzati.

Arcee afferma che SuperNova eccelle particolarmente nel ragionamento matematico e sta incoraggiando valutazioni di terze parti per confermare queste affermazioni. Questo potrebbe essere particolarmente utile per settori come finanza e ricerca scientifica.

Il lancio di SuperNova rappresenta un possibile cambiamento nel panorama dell’IA aziendale. Mentre i servizi API basati su cloud hanno dominato finora, c’è un crescente interesse per modelli distribuibili che offrono maggiore controllo e personalizzazione.

SuperNova si distingue per:

  • Riservatezza dei dati: garantisce che i dati rimangano sotto controllo aziendale.
  • Stabilità del modello: offre un modello stabile che non cambia senza preavviso.
  • Personalizzazione approfondita: consente riaddestramenti specifici per le esigenze aziendali.
  • Controllo dei costi: potrebbe risultare più conveniente rispetto all’uso di API su larga scala.

La sfida sarà vedere se SuperNova riuscirà a combinare il controllo e la personalizzazione con le prestazioni di alto livello dei modelli basati su cloud. Questo modello potrebbe rappresentare una nuova direzione per l’IA aziendale, offrendo un equilibrio tra controllo interno e capacità avanzate.

Di Fantasy