Oliver Molander ha ironizzato su LinkedIn dicendo che se avesse chiesto agli esperti di intelligenza artificiale cosa fosse un LLM prima del 2022, molti avrebbero risposto scherzosamente che si trattava di una laurea in giurisprudenza. Ha aggiunto che molti trovano difficile accettare che l’intelligenza artificiale vada oltre i semplici LLM e modelli da testo a video.
Inoltre, ha sottolineato che, nonostante tutto il clamore attorno a tecniche come i modelli LLM e RAG, XGBoost, noto anche come Extreme Gradient Boosting, si dimostra il vero vincitore quando si tratta di dati tabulari e di dare un senso ai fogli. Ha chiarito che XGBoost rimane senza pari, soprattutto nei settori che fanno affidamento su set di dati tabulari.
Ha anche spiegato che, pur non essendo direttamente comparabili, tecniche come XGBoost, deep learning e RAG condividono l’obiettivo di recuperare informazioni e generare output.
Inoltre, ha evidenziato i risultati di uno studio condotto nel luglio 2022, che ha dimostrato che modelli basati su alberi come XGBoost e Random Forests continuano a superare le reti neurali profonde quando applicati a set di dati tabulari.
RAG è stato introdotto nel 2020 per fornire agli LLM le tecniche di informazione necessarie. Anche se ha portato a nuovi sviluppi, ha sollevato preoccupazioni sulla sicurezza e la privacy dei dati.
Infine, ha concluso che mentre i Transformers hanno rivoluzionato l’intelligenza artificiale generativa, XGBoost rimane la scelta preferita per i dati tabulari, poiché si dimostra più affidabile in questo ambito.