Il formato di file JSON (JavaScript Object Notation) è molto popolare perché è facile da leggere per gli esseri umani e semplice da analizzare per le macchine.
Tuttavia, i modelli di linguaggio di grandi dimensioni (LLM) spesso incontrano problemi con JSON: possono generare risposte imprecise, parziali o difficili da interpretare.
Questo obbliga spesso gli sviluppatori a cercare soluzioni alternative, come strumenti open source o molteplici tentativi di richiesta, per garantire la corretta interoperabilità dell’output.
OpenAI ha appena rilasciato una nuova funzionalità chiamata Structured Outputs nell’API. Questa funzione aiuta a garantire che le risposte dei modelli seguano esattamente gli schemi JSON predefiniti, che sono essenziali per descrivere il contenuto e la struttura dei documenti JSON.
Il CEO di OpenAI, Sam Altman, ha annunciato che questa è la funzionalità più richiesta dagli sviluppatori e ha confermato che la release è “stato un desiderio esplicito”. L’azienda ha anche dichiarato che il suo nuovo GPT-4o ha ottenuto un “perfetto 100%” nelle valutazioni con Structured Outputs.
L’annuncio arriva dopo una settimana movimentata per OpenAI, con le dimissioni di tre dirigenti chiave e una nuova causa legale da parte di Elon Musk, che ha accusato l’azienda di tradire la sua missione di intelligenza artificiale.
La nuova funzionalità Structured Outputs facilita il rispetto degli schemi JSON. OpenAI spiega che, mentre la modalità JSON precedente garantiva solo la validità del JSON, Structured Outputs assicura che il modello aderisca anche allo schema specifico, evitando errori come chiavi mancanti o valori non validi. Gli sviluppatori possono ora guidare gradualmente il modello verso l’output desiderato senza preoccuparsi di risposte formattate in modo errato.
Structured Outputs è disponibile su GPT-4o-mini, GPT-4 e le versioni ottimizzate di questi modelli, e può essere utilizzato con le API Chat Completions, Assistants e Batch, oltre a supportare gli input visivi. OpenAI ha sottolineato che questa funzionalità si ispira al lavoro della comunità open source, in particolare alle librerie outlines, jsonformer, teachers, guidance e lark.