Matt Shumer, co-fondatore e CEO della startup HyperWrite, ha annunciato il lancio di Reflection 70B, un avanzato modello linguistico open source. Basato su Llama 3.1-70B Instruct di Meta, questo modello si distingue per la sua capacità di autocorrezione e prestazioni superiori nei benchmark di terze parti.

Reflection 70B ha dimostrato di superare i modelli della serie Llama di Meta e di competere con i modelli commerciali più avanzati. Grazie alla nuova tecnica di “reflection tuning”, il modello può rilevare e correggere errori nel suo ragionamento prima di fornire una risposta, migliorando così l’accuratezza.

Puoi provare Reflection 70B in una demo online, ma il traffico elevato ha causato alcune difficoltà nel fornire l’accesso. Il modello è disponibile per il download su Hugging Face e l’accesso API sarà presto offerto da Hyperbolic Labs.

Reflection 70B introduce token speciali per il ragionamento e la correzione degli errori. Durante l’elaborazione, il modello utilizza questi token per emettere il suo ragionamento e correggere eventuali errori in tempo reale.

Shumer ha spiegato che la tecnica di autocorrezione, che permette al modello di riflettere sul testo generato e valutarne l’accuratezza, è ciò che rende Reflection 70B così innovativo. Questo approccio rende il modello particolarmente utile per compiti che richiedono alta precisione.

In futuro, HyperWrite prevede di lanciare Reflection 405B, un modello ancora più potente. Inoltre, l’azienda sta lavorando per integrare Reflection 70B nel suo prodotto principale di assistenza alla scrittura.

Il successo di Reflection 70B è in parte dovuto ai dati sintetici creati da Glaive, una startup che ha accelerato il processo di addestramento del modello. Glaive si specializza nella generazione di set di dati specifici per casi d’uso, facilitando lo sviluppo rapido di modelli specializzati.

Shumer prevede che Reflection 405B supererà le prestazioni dei modelli proprietari come GPT-4 di OpenAI. Questo rappresenta una sfida per i leader del settore come OpenAI, Anthropic e Microsoft. Reflection 70B segna una pietra miliare per l’intelligenza artificiale open source, offrendo strumenti potenti che possono competere con i modelli commerciali più avanzati.

Di Fantasy