Molte startup di intelligenza artificiale (AI) stanno utilizzando i dati generati da “ChatGPT” di OpenAI per costruire i propri chatbot. Questa pratica, considerata un furto di dati, è ampiamente nota nel settore. Le startup pagano per l’accesso a modelli come “GPT-4” di OpenAI, utilizzano i dati generati da questi modelli per addestrare i propri e migliorarli. In altre parole, usano i “dati generati” per ottimizzare le prestazioni del loro software.
Molte di queste aziende non dichiarano apertamente di utilizzare i modelli AI aperti per costruire i propri prodotti. Daniel Han, co-fondatore di Earnslaw AI, ha stimato che circa la metà delle aziende generi dati da modelli come GPT-4 o “Claude” di Anthropic. Alcuni sviluppatori utilizzano servizi come “OpenPipe” per automatizzare questo processo.
Tuttavia, questo approccio può essere rischioso per le startup, poiché le principali aziende di intelligenza artificiale come OpenAI, Antropic e Google tecnicamente vietano queste azioni. Il CEO di OpenAI, Sam Altman, ha detto che le piccole startup possono utilizzare la tecnologia dell’azienda in questo modo, ma potrebbe esserci un cambiamento di politica in futuro se questo diventa un ostacolo alla crescita.
Anche grandi aziende come OpenAI e Meta non sono esenti da controversie simili. Ad esempio, OpenAI ha utilizzato un programma di riconoscimento vocale chiamato “Whisper” per trascrivere audio dai video di YouTube e alimentare il suo modello GPT-4, acquisendo più di un milione di ore di contenuto, alcune delle quali potrebbero essere protette da copyright. Meta, d’altra parte, ha utilizzato dati protetti da copyright senza autorizzazione, come romanzi e articoli di notizie, oltre ai post di Facebook e Instagram.
Tuttavia, ci sono aziende che scelgono di non seguire questa strada. Jonathan Frankel, capo scienziato di Databricks, ha dichiarato che la sua azienda non ha dipenduto dal lavoro di altre società per sviluppare il loro modello di linguaggio, mentre Anthropic ha affermato di non utilizzare i risultati di altri modelli per addestrare i propri.