Nell’intelligenza artificiale applicata al design, un’innovazione degna di nota è rappresentata da StarVector, un modello sviluppato dai ricercatori di ServiceNow. Questo strumento rivoluziona la creazione di grafica vettoriale scalabile (SVG) attraverso l’uso di input testuali e visivi, offrendo nuove prospettive per designer e sviluppatori.​
StarVector è un Large Language Model (LLM) multimodale progettato specificamente per la generazione di SVG. A differenza dei metodi precedenti, che spesso producevano risultati imprecisi o artefatti, StarVector lavora direttamente nello spazio del codice SVG. Questo approccio gli consente di comprendere e applicare con precisione le primitive SVG, generando output compatti e semanticamente ricchi.​

Per addestrare StarVector, i ricercatori hanno sviluppato SVG-Stack, un vasto dataset composto da 2 milioni di campioni. Hanno inoltre introdotto SVG-Bench, un benchmark che valuta le prestazioni del modello su dieci dataset diversi e tre compiti principali:​

  • Generazione Immagine-to-SVG: Trasformazione di immagini in codice SVG corrispondente.​
  • Generazione Testo-to-SVG: Creazione di SVG basati su descrizioni testuali.​
  • Generazione di Diagrammi: Produzione di diagrammi dettagliati e precisi.​
  • Architettura e Funzionamento di StarVector

L’architettura di StarVector combina un encoder immagine, che converte le immagini in token visivi, e un modello di linguaggio transformer. Questa combinazione permette al modello di apprendere le relazioni tra istruzioni testuali, caratteristiche visive e sequenze di codice SVG. Di conseguenza, StarVector è in grado di eseguire attività come la vettorializzazione delle immagini e la generazione di SVG basati su testo con elevata precisione.​

I risultati ottenuti con StarVector superano quelli di modelli precedenti in compiti di generazione immagine-to-SVG e testo-to-SVG. Ad esempio, ha dimostrato prestazioni superiori rispetto a GPT-4 Vision e Potrace, due strumenti noti nel campo della grafica vettoriale.​

StarVector è attualmente disponibile come progetto open-source su Hugging Face, mentre il codice sorgente è accessibile su GitHub sotto la licenza Apache 2.0. Nonostante i progressi, il modello può occasionalmente produrre dettagli imprecisi. I ricercatori di ServiceNow stanno lavorando attivamente per affrontare e risolvere queste sfide, con l’obiettivo di migliorare ulteriormente l’affidabilità e la precisione di StarVector.

Di Fantasy