Immagine AI

In un mondo dove dati, contenuti e documenti si intrecciano sempre più strettamente con l’intelligenza artificiale, l’ultimo annuncio di Korea Deep Learning mostra un passo deciso verso l’efficienza: il lancio ufficiale di Deep Parser, una soluzione che promette di convertire documenti non strutturati in formati strutturati, utili per alimentare modelli linguistici di grande scala (LLM) e supportare applicazioni pratiche di AI su contenuti scritti.

L’idea di fondo è semplice da enunciare, ma complessa da realizzare: molti documenti — contratti, report, articoli PDF, immagini digitalizzate di testi — contengono informazioni preziose, ma sono difficili da “leggere” per le AI. L’innovazione di Deep Parser sta nel suo saper “vedere” non solo il testo, ma il layout, la gerarchia, le strutture — in altre parole, la semantica implicita del documento. Secondo quanto reso noto, il sistema è in grado di riconoscere fino a 23 tipologie di elementi differenti (titoli, corpo del testo, tabelle, didascalie, forme, ecc.) e di convertire file originali (PDF, HWP, JPEG) in formati come HTML, JSON, Markdown e XML.

Un aspetto che distingue Deep Parser è la segmentazione automatica dei documenti di grande dimensione in unità “significative”: invece di cercare di processare un testo enorme come un blocco unico, il sistema “taglia” con intelligenza il documento in parti semanticamente coerenti, rendendo più efficiente l’elaborazione da parte di modelli AI downstream. Questo, dicono dall’azienda, si traduce in una riduzione significativa del tempo di pre-elaborazione, una fase spesso laboriosa nelle pipeline AI che lavorano su testi complessi.

Non solo: Deep Parser offre moduli opzionali per riconoscere tabelle complesse, analizzare immagini all’interno dei documenti e applicare protezioni sulla privacy (protezione di dati sensibili). E per facilitare l’adozione in ambiente aziendale, Korea Deep Learning ha reso disponibile una integrazione API che permette di inserire il parser all’interno di sistemi interni già esistenti — ERP, RPA, piattaforme documentali — senza dover ripensare interamente l’architettura IT.

Dal punto di vista economico, l’azienda ha dichiarato che la licenza base parte da 50 milioni di won (circa decine di migliaia di euro, a seconda del cambio), con la possibilità di aggiungere moduli opzionali a partire da altri 10 milioni di won ciascuno. È prevista anche una demo online: le aziende che si preregistrano potranno caricare propri documenti e vedere direttamente come Deep Parser li trasforma. Il link alla demo verrà inviato via email successivamente.

Un altro pezzo del puzzle strategico si trova nella collaborazione con WiseNut e Conan Technology, due aziende specializzate in sistemi di ricerca AI (intelligenza artificiale applicata a ricerche testuali). Korea Deep Learning ha costruito un’integrazione nel quale i dati strutturati prodotti da Deep Parser alimentano piattaforme RAG (retrieval-augmented generation) e motori di ricerca — una combinazione che secondo le aziende migliora la precisione delle risposte agli utenti e accelera la ricerca di documenti correlati.

Il CEO Kim Ji-hyun ha commentato che Deep Parser “va oltre l’estrazione di testo”: non si limita a copiare e incollare testo, ma mira a segmentare unità semantiche con precisione, in modo da ottimizzare l’uso degli LLM. Insieme ai partner, l’azienda punta a espandere l’ecosistema, offrendo API, demo e un percorso più fluido dalla fase PoC (proof-of-concept) alla commercializzazione.

Guardando più a fondo, si può collocare Deep Parser all’interno di un filone in crescita: l’IA documentale strutturata. Sempre più aziende e istituzioni hanno bisogno che i loro archivi—magazzini di documenti, legislative, rapporti, pubblicazioni storiche, certificazioni—diventino “leggibili” da algoritmi intelligenti. Una AI che risponda a domande su un’intera raccolta documentale, comprenda contesti e relazioni strutturali piuttosto che solo parole isolate, richiede sistemi come Deep Parser.

Di Fantasy