l campo dell’intelligenza artificiale (IA) generativa nella generazione di codice si espande con il lancio di StarCoder, un nuovo modello di linguaggio di grandi dimensioni (LLM). StarCoder fa parte di BigCode, un progetto collaborativo tra ServiceNow e Hugging Face, che mira a creare una comunità aperta attorno agli strumenti di generazione di codice per l’IA. Addestrato su codice sorgente disponibile su GitHub, StarCoder LLM ha 15 miliardi di parametri e supporta oltre 80 linguaggi di programmazione, con una particolare competenza in Python.
Questo sforzo per creare un generatore di codice aperto basato sull’IA sfida i concorrenti come Codex di OpenAI e CodeWhisper di Amazon, entrambi basati su codice proprietario. Al contrario, StarCoder è rilasciato con una licenza Open Responsible AI Licenses (OpenRAIL).
Leandro von Werra di Hugging Face afferma che l’obiettivo di BigCode e StarCoder è quello di creare modelli di generazione di codice potenti e aperti. BigCode segue il precedente progetto di Hugging Face, BigScience, che mirava a offrire un’alternativa aperta al GPT-3 di OpenAI.
StarCoder supporta 80 linguaggi e può essere utilizzato come assistente di codifica o integrato con strumenti di sviluppo popolari come Microsoft VS Code. Un elemento chiave di StarCoder e BigCode è l’uso di licenze aperte per garantire un’IA spiegabile e responsabile, evitando usi impropri del codice, come la creazione di ransomware o attacchi di social engineering. La licenza Code Open RAIL-M permette di vedere il codice all’interno del modello con restrizioni per garantire il rispetto dei principi di intelligenza artificiale responsabile.
StarCoder, un nuovo modello di linguaggio di grandi dimensioni (LLM) per la generazione di codice basato sull’intelligenza artificiale generativa. StarCoder è stato sviluppato da BigCode, un progetto congiunto tra ServiceNow e Hugging Face, con l’obiettivo di creare una comunità aperta attorno agli strumenti di generazione di codice per l’intelligenza artificiale. Il modello StarCoder è composto da 15 miliardi di parametri ed è stato addestrato su codice sorgente concesso in licenza in modo permissivo e disponibile su GitHub, coprendo più di 80 linguaggi di programmazione, con particolare forza nel linguaggio Python.
Si mette in evidenza la competizione tra StarCoder e altri strumenti di generazione di codice basati sull’intelligenza artificiale, come Codex di OpenAI (che alimenta il servizio co-pilota di GitHub) e CodeWhisper di Amazon. A differenza di questi strumenti, StarCoder viene rilasciato con una licenza Open Responsible AI Licenses (OpenRAIL), il che significa che è un progetto open source.
BigCode è il “successore spirituale” del progetto BigScience, che mirava a creare un’alternativa aperta al GPT-3 di OpenAI. Nel corso della sua evoluzione, BigCode ha rilasciato diversi progetti come “The Stack” e “SantaCoder”, portando infine allo sviluppo di StarCoder, che può essere utilizzato come assistente di codifica e integrato con strumenti di sviluppo popolari come Microsoft VS Code.
Si sottolinea l’importanza della licenza aperta utilizzata da StarCoder e BigCode in generale, in quanto consente un’intelligenza artificiale spiegabile e responsabile, con restrizioni che impediscono l’utilizzo improprio del codice, come la generazione di ransomware o attacchi di social engineering.