Gyan AI Research, un’azienda specializzata nello sviluppo di potenti modelli linguistici, ha lanciato PARAMANU-AYN, un nuovo modello di elaborazione del linguaggio naturale (PNL) progettato specificamente per il contesto legale indiano.
Questo modello si basa esclusivamente sui documenti della Corte Suprema dell’India, sulla Costituzione indiana e sul Codice penale indiano. È stato costruito da zero per adattarsi al dominio legale indiano, con una dimensione del contesto di 8192.
Dopo un’adeguata formazione sul corpus giuridico, i ricercatori hanno ottimizzato PARAMANU-AYN su oltre 10.000 istruzioni che spaziano da compiti legali come la redazione di contratti, la sintesi di casi e le risposte a questioni costituzionali.
Per valutare le capacità del modello, i ricercatori hanno confrontato le risposte di PARAMANU-AYN con quelle di GPT-3.5-Turbo, utilizzando parametri come chiarezza, pertinenza, completezza e capacità di ragionamento legale. Il modello ha ottenuto punteggi compresi tra 7 e 8 su 10 su questi parametri per le istruzioni legali.
PARAMANU-AYN dimostra di essere efficiente anche sulle CPU, con una velocità di inferenza di oltre 42 token al secondo su un processore AMD a 8 core. I ricercatori hanno notato che il modello è in grado di apprendere la conoscenza del dominio legale necessaria per compiti come la redazione di contratti da una quantità relativamente piccola di dati didattici, senza richiedere una formazione preliminare su libri legali completi.
Questo lavoro rappresenta un’innovazione nel campo dei modelli linguistici giuridici, in particolare per quanto riguarda il contesto legale indiano. Tuttavia, i ricercatori riconoscono alcune limitazioni, come il rischio di errori derivanti dai dati di addestramento, la necessità di una valutazione umana e l’assenza di meccanismi di sicurezza nel sistema attuale.