Microsoft, nota per la sua sede a Redmond, non si accontenta dei successi ottenuti grazie alla collaborazione con OpenAI. Oggi, l’azienda ha presentato tre nuovi modelli nella sua serie Phi di intelligenza artificiale linguistica e multimodale.

I nuovi modelli Phi-3.5 sono:

  • Phi-3.5 Mini Instruct: Con 3,8 miliardi di parametri, questo modello è ottimizzato per attività di base e rapida esecuzione. È ideale per scenari con limitazioni di calcolo, come la generazione di codice e la risoluzione di problemi matematici. Nonostante le sue dimensioni, offre ottime prestazioni nei test e supera modelli simili come Llama-3.1-8B e Mistral-7B.
  • Phi-3.5 MoE: Questo modello “Mixture of Experts” ha un’architettura complessa con 42 miliardi di parametri, ma utilizza solo 6,6 miliardi di parametri attivi in ogni operazione. È progettato per compiti di ragionamento complessi, come la comprensione del codice e la matematica, e supera modelli come GPT-4o nei test MMLU.
  • Phi-3.5 Vision Instruct: Un modello multimodale con 4,15 miliardi di parametri, in grado di gestire testo e immagini. Eccelle in compiti come il riconoscimento ottico dei caratteri e la sintesi video. Supporta anche una lunga lunghezza di contesto del token di 128k.

Tutti e tre i modelli sono disponibili per il download su Hugging Face con una licenza MIT, che consente agli sviluppatori di usarli e modificarli senza restrizioni. I modelli hanno ottenuto punteggi eccellenti nei benchmark e sono considerati all’avanguardia in molte aree rispetto ai concorrenti come Google Gemini 1.5 Flash, Meta Llama 3.1 e OpenAI GPT-4o.

Microsoft ha addestrato questi modelli con enormi quantità di dati e risorse computazionali, confermando il suo impegno verso l’innovazione e il supporto alla comunità open source.

Il lancio della serie Phi-3.5 rappresenta un importante passo avanti nel campo dell’IA, offrendo nuove opportunità per sviluppatori e ricercatori.

Di Fantasy