Il settore dell’intelligenza artificiale sta assistendo a una crescente specializzazione, con modelli non più generici, ma affinati per domini di conoscenza specifici e complessi. In questo contesto, Nara Knowledge Information ha presentato al suo ‘2025 Demo Day’ una soluzione rivoluzionaria: Cornerstone LM (Cornerstone Language Model), un agente di intelligenza artificiale sviluppato specificamente per la ricerca e l’interpretazione dei documenti classici e storici. Questo evento annuale, incentrato sul tema degli “Agenti di intelligenza artificiale affidabili”, ha messo in luce i progressi notevoli compiuti nel decifrare e rendere accessibile l’immenso patrimonio scritto dell’Asia orientale.
L’agente Cornerstone LM rappresenta il culmine di anni di sviluppo focalizzato sulla tecnologia di Riconoscimento Ottico dei Caratteri (OCR) basata sull’IA, essenziale per affrontare la complessità unica dei caratteri cinesi presenti nei documenti antichi, spesso redatti in calligrafie corsive e semicorsive. Già nel 2023, i ricercatori avevano annunciato una precisione media di riconoscimento che superava il 90% in questi stili di scrittura sfidanti. Il progresso è continuato nel 2024, con l’introduzione di un modello capace di analizzare anche i “caratteri misti coreani e cinesi”, portando la precisione media al 94,8%. Cornerstone LM è il risultato di ulteriori affinamenti, che hanno risolto gli squilibri nei dati e potenziato le prestazioni di traduzione in tempo reale. Il modello si distingue non solo per l’elevata precisione nel riconoscimento dei caratteri cinesi in diversi stili calligrafici – Haeseo, Seongseo e corsivo – ma anche per la certificazione KOLAS ottenuta dalla sua tecnologia AI OCR, un marchio di affidabilità nel campo.
La completezza di Cornerstone LM è evidente nelle sue funzionalità dettagliate, che superano ampiamente le capacità di base di riconoscimento del demo site precedente, ADoc Cube. Le nuove funzioni includono: caricamento di documenti e immagini, specifiche del processo di inferenza (o pensiero), citazione precisa della fonte (nome e posizione del file), funzione di evidenziazione delle immagini e, crucialmente, la possibilità di modifica diretta da parte dell’utente e l’integrazione con una knowledge base aggiornabile. Questa ultima funzionalità è fondamentale per rendere l’IA un partner nella ricerca, non solo un interprete passivo.
Durante la dimostrazione sul campo, l’agente ha mostrato le sue capacità in azione, utilizzando come esempio gli Annali del Re Taejong per illustrare il processo di caricamento dei documenti e la traduzione in coreano in tempo reale. Sebbene il modello di base di Cornerstone LM si appoggi ancora al modello BERT di Google per la sua robustezza, i modelli più recenti, inclusi quelli come GPT, sono utilizzati in modo selettivo esclusivamente per ottimizzare e snellire le frasi, preservando l’accuratezza del contenuto storico.
L’importanza di questo lavoro risiede nel suo essere un Modello Linguistico di Grandi Dimensioni (LLM) specifico per un dominio. Questo tipo di specializzazione è essenziale per gli esperti e per i settori accademici, dove l’accuratezza e la fedeltà al contesto sono parametri non negoziabili. I confronti effettuati durante il Demo Day hanno mostrato come soluzioni generiche, come NotebookLM, abbiano prestazioni significativamente inferiori nella comprensione dei caratteri cinesi nei documenti classici e siano più inclini a generare “allucinazioni” nelle citazioni. Al contrario, Cornerstone LM è progettato per garantire l’affidabilità, consentendo agli utenti di migliorare costantemente la precisione attraverso il loro input.
Il ricercatore senior Lee Kyu-min ha enfatizzato che l’obiettivo di Cornerstone LM va oltre la semplice Generazione Aumentata del Recupero (RAG), che da sola non è sufficiente a garantire un’IA veramente affidabile. L’agente mira a essere una soluzione più fidata sostenendo il “diritto di modifica degli utenti” e garantendo un elevato tasso di riconoscimento di base certificato. Questo approccio ha portato il progetto a qualificarsi per le fasi finali del prestigioso “Campionato di Intelligenza Artificiale 2025”, un risultato che testimonia la sua eccellenza. Il National Knowledge Information Service prevede di completare le funzioni iniziali del modello entro la fine del mese, segnando un passo cruciale verso l’apertura di un’era in cui l’IA rende accessibile la saggezza dei classici.
