Meta mette in discussione i benchmark di codifica: SWE-Bench Verified non è così affidabile come sembrava
Per anni i benchmark sono stati considerati il metro di misura più sicuro per valutare le capacità dei modelli di intelligenza artificiale. Nel campo della programmazione, in particolare, SWE-Bench Verified…
Il “Rasoio” del Reinforcement Learning: come l’AI può imparare senza dimenticare
Uno dei grandi dilemmi dell’intelligenza artificiale riguarda la cosiddetta “dimenticanza catastrofica”: la tendenza dei modelli a perdere competenze acquisite in precedenza quando vengono addestrati su nuovi compiti. È come se…
Sam Altman nell’occhio del ciclone: l’assurda accusa durante un’intervista con Tucker Carlson
Ci sono interviste che segnano uno spartiacque non tanto per ciò che rivelano, quanto per le domande che pongono. È il caso del recente confronto tra Sam Altman, CEO di…
La polizia di Londra smentisce falsa affermazione di Grok xAI
In un’epoca in cui l’intelligenza artificiale è ormai parte integrante delle nostre vite, dalla gestione delle informazioni alla diffusione delle opinioni, emerge con forza la questione della veridicità: quanto ci…
Hacker nordcoreani usano l’AI per creare documenti falsi: il nuovo volto del cyberspionaggio
La linea che separa l’innovazione tecnologica dal suo abuso criminale continua ad assottigliarsi. Negli ultimi mesi, diversi rapporti hanno mostrato come l’intelligenza artificiale, pensata per semplificare la vita quotidiana e…
NVIDIA e la ricerca assistita con UDR Universal Deep Research
La recente proposta di NVIDIA, nota come Universal Deep Research (UDR), rappresenta un punto di svolta nel mondo degli strumenti di ricerca basati sull’intelligenza artificiale. Finora, quando si parlava di…
Britannica vs Perplexity: conflitto tra diritto d’autore, marchio e risposte AI
È una delle controversie legali più recenti e significative nell’universo dell’intelligenza artificiale, un conflitto che mette al centro domande importanti sul rapporto tra chi crea contenuti, chi li aggrega, chi…
Crawl-to-refer: Claude di Anthropic scansiona migliaia di pagine, ma quanti clic restituisce?
C’è qualcosa di inquietante nella dinamica che si sta delineando tra le piattaforme di intelligenza artificiale, i creatori di contenuti sul web, e il modo in cui il traffico —…
Rolling Stone e media contro Google per AI Overview
C’è qualcosa di profondo in quello che sta accadendo tra Google e alcune grandi testate giornalistiche: non solo una disputa sui diritti d’autore, ma un conflitto che sottolinea quanto l’intelligenza…
Il ritardo dell’AI nel portare farmaci sul mercato
Quando si guarda indietro agli ultimi dieci anni, si vede un panorama pieno di promesse: startup con nomi affascinanti, fondi raccolti, algoritmi potenti, modelli predittivi che parevano usciti da romanzi…