Kakao ha svelato una nuova gamma di modelli di intelligenza artificiale (AI) durante la conferenza per sviluppatori “if KAKAO”. L’azienda ha riferito che i suoi modelli hanno superato le prestazioni di quelli globali in alcuni test benchmark coreani, ma non ha rivelato i dettagli specifici sui modelli o sui parametri di confronto.
Kakao, sotto la direzione del CEO Jeong Shin-ah, ha introdotto il modello “KANANA”, presentato il giorno precedente alla conferenza. Kim Byeong-hak, responsabile dello sviluppo del modello AI, ha spiegato che l’azienda sta aggiornando modelli già esistenti come “CoGPT”, “Kalo” e “Honeybee”, rendendo KANANA un modello ottimizzato per i servizi Kakao.
In totale, Kakao ha presentato dieci modelli, tra cui tre modelli linguistici di grandi dimensioni (LLM), tre modelli multimodali (MLLM), due modelli per la generazione di immagini e video, e due modelli vocali. Tra questi, “
Kanana Essence”, un LLM di dimensioni medie, e “Kanana Nano”, un piccolo modello linguistico adatto per dispositivi mobili, sono già utilizzati nei servizi di Kakao.
Kim ha annunciato che il modello più avanzato, Kanana, è attualmente in fase di sviluppo e che l’obiettivo è creare un modello competitivo a livello globale. Durante la presentazione, il modello “Essence” è stato particolarmente enfatizzato, descritto come ottimizzato per vari ambienti di servizio.
Kakao ha informato che il set di dati utilizzato per il modello è stato creato attraverso un attento filtraggio e cura dei dati, risolvendo anche problemi di copyright e privacy. Il modello Essence ha dimostrato prestazioni simili o superiori a modelli globali nei benchmark che valutano la logica e il ragionamento in lingua coreana, ma non sono stati forniti dettagli sui risultati specifici.
In aggiunta, Kakao ha introdotto un “modello Instruct” che aiuta gli utenti a seguire chiaramente le istruzioni. Le prestazioni in termini di generazione di risposte aumentate e chiamate di funzione sono state riportate come vicine o superiori a quelle del modello GPT-4o di OpenAI.
Kakao ha anche rilasciato un video dimostrativo dell’app “Kanana-o (Omni)”, in grado di comprendere immagini e voci, permettendo interazioni semplici attraverso domande e risposte. Kim ha aggiunto che l’azienda intende evolversi in un modello linguistico multimodale integrato, capace di generare voci, immagini e video per fornire risposte più intuitive.
Infine, Kakao ha presentato il modello di creazione di immagini “Kollage by Kanana” e il modello di creazione di video “Kinema by Kanana”. Il modello Kinema non solo genera video, ma semplifica anche il controllo dei movimenti della telecamera e dei personaggi, facilitando la produzione di contenuti video di alta qualità. Tuttavia, la data di rilascio per questi modelli non è stata ancora comunicata.