Quando gli LLM “allucinano”: il paradosso dei benchmark che incoraggiano le risposte inventate
In un mondo dove il progresso nell’intelligenza artificiale è ormai all’ordine del giorno, OpenAI ha acceso un dibattito cruciale: e se fossero proprio i metodi attuali di valutazione a incoraggiare…