I ricercatori della Chung-Ang University sviluppano un algoritmo per un processo decisionale ottimale con ricompense rumorose dalla coda pesante
I ricercatori propongono metodi che teoricamente garantiscono una perdita minima per gli scenari peggiori con informazioni preliminari minime per distribuzioni di premi a coda pesante Banditi ottimali Minimax per ricompense…