Scoprire come funzionano gli LLM con JumpReLU SAE di Google DeepMind
Negli ultimi anni, i modelli linguistici di grandi dimensioni (LLM) hanno fatto enormi progressi. Tuttavia, capire come funzionano rimane una sfida, e gli scienziati stanno cercando di “sbirciare” all’interno di…