Categoria: Intelligenza Artificiale di Ragionamento

TrueBench: il banco di prova di Samsung per valutare l’efficacia AI nel lavoro reale

Samsung Electronics ha da poco annunciato il lancio di TrueBench, un benchmark interno concepito per misurare in modo più realistico e completo le capacità dei modelli di intelligenza artificiale nel…

Quando l’Intelligenza Artificiale si perde nella verosimiglianza: il problema del machine bullshit

Talvolta ti trovi davanti un testo generato da un’intelligenza artificiale che scorre fluido, perfettamente credibile, talmente convincente da sembrare scritto da uno di noi. Le frasi sono ben strutturate, lo…

La vittoria dei modelli di OpenAI e Google DeepMind alla ICPC, competizione di programmazione universitaria

Negli ultimi anni l’idea che l’intelligenza artificiale potesse imitare certi aspetti del ragionamento umano non è più roba da fantascienza. Ma ciò che è accaduto recentemente alla finale mondiale del…