Patronus AI ha introdotto CopyrightCatcher, una soluzione rivoluzionaria nel campo della rilevazione di contenuti protetti da copyright generati dai Large Language Model (LLM).
CopyrightCatcher è progettato per individuare quando gli LLM producono riproduzioni esatte di contenuti provenienti da fonti testuali come libri. Questo strumento può valutare gli output degli LLM per la presenza di materiale protetto da copyright e evidenziare le sezioni specifiche che lo contengono.
Le prime ricerche condotte da Patronus AI hanno dimostrato che i LLM di punta generano contenuti protetti da copyright a una frequenza preoccupante. Utilizzando un set di test composto da 100 prompt contrastanti, i ricercatori di Patronus AI hanno esaminato quanto frequentemente i modelli generassero riproduzioni esatte. Risultati preliminari hanno mostrato che:
- GPT-4 di OpenAI ha prodotto contenuti protetti da copyright nel 44% dei prompt.
- Mixtral-8x7B-Instruct-v0.1 di Mistral ha prodotto contenuti protetti da copyright nel 22% dei prompt.
- Claude-2.1 di Anthropic ha prodotto contenuti protetti da copyright nell’8% dei prompt.
- La chat Llama-2-70b di Meta ha prodotto contenuti protetti da copyright nel 10% dei messaggi.
Anand Kannappan, CEO e co-fondatore di Patronus AI, ha espresso preoccupazione riguardo al diffuso utilizzo di LLM e alle potenziali violazioni del copyright da parte di tali modelli. Ha sottolineato l’importanza di soluzioni come CopyrightCatcher per mitigare tali rischi, specialmente in assenza di chiarezza riguardo alle responsabilità.
Con questa nuova versione, i clienti possono ora valutare in modo scalabile i propri sistemi LLM utilizzando CopyrightCatcher sulla piattaforma Patronus AI. Questo strumento è già utilizzato con successo da aziende Fortune 500 per rilevare comportamenti imprevisti e altri rischi associati agli LLM.