I cinque principali progetti di serie storiche per gli appassionati di ML
Come suggerisce il nome, un insieme ordinato di osservazioni effettuate in un periodo di tempo è una serie temporale. Poiché le serie temporali contengono punti dati sequenziali mappati in una durata temporale successiva, può essere uno strumento molto importante per fare previsioni. Alcune delle sue principali aree di applicazione includono: azioni e trading finanziario, analisi delle vendite al dettaglio online e offline e cartelle cliniche come frequenza cardiaca, ECG, MRI ed ECG. I dati delle serie temporali sono uno dei tipi di dati più comuni oggi disponibili. Questi dati possono variare tra le fluttuazioni salariali annuali di una persona ai valori del mercato azionario.
Di seguito elenchiamo cinque progetti di serie temporali di machine learning open source , in nessun ordine particolare, su cui gli appassionati possono provare:
Analisi delle serie storiche del tasso di inflazione utilizzando Shinyboard
L’obiettivo di questo progetto è analizzare e studiare i tassi di inflazione dei paesi e delle principali unioni economiche di tutto il mondo. Il set di dati utilizzato per questo progetto può essere tratto dai dati pubblici resi disponibili dal Fondo monetario internazionale (FMI). In questo progetto, in particolare, i dati dal 1980 al 2017 erano e il tasso di inflazione previsto dei paesi fino al 2022 è stato ottenuto. Il cruscotto lucido è stato realizzato in R.
Visita qui per maggiori informazioni.
Previsione del traffico Internet mediante metodi di serie temporali
Con questo progetto , la quantità di traffico sulle reti TCP / IP può essere prevista utilizzando il metodo di previsione delle serie temporali. I dati sono stati raccolti da due fornitori di fonti Internet e sono stati analizzati utilizzando diverse previsioni anticipate e scale temporali. Il progetto ha utilizzato due metodi di serie temporali: ARIMA e Holt-Winters. Nell’esperimento originale, le prestazioni della previsione del traffico con il metodo delle serie temporali sono state confrontate con un nuovo approccio di insieme di reti neurali.
Previsione delle serie temporali dei prezzi delle azioni Amazon utilizzando LSTM e GAN
Questo progetto utilizza Python per analizzare i dati di Amazon Stock. L’estrazione delle caratteristiche viene eseguita e i modelli delle serie ARIMA e Fourier vengono costruiti a questo proposito. La memoria a lungo termine (LSTM) è stata utilizzata con molteplici funzionalità per prevedere i prezzi delle azioni. Insieme a ciò, le reti generative adversarial ( GAN ) vengono utilizzate per prevedere i prezzi sui dati recuperati da un’API come generatore e la CNN come discriminatore.
Rilevamento di anomalie ECG tramite analisi di serie temporali
Questo progetto propone uno schema di rilevamento delle anomalie dipendente dall’analisi delle serie temporali. In questo progetto, i computer saranno in grado di analizzare i dati dei sensori in tempo reale per identificare eventuali battiti cardiaci anomali. In caso di rilevamento di un’anomalia, il particolare segmento della serie temporale verrà trasmesso al medico per intraprendere le azioni appropriate.
Previsione della popolarità degli sport utilizzando l’analisi delle serie storiche
Questo progetto intende misurare la popolarità di ogni campionato utilizzando i dati di ricerca raccolti da Google Trends, che forniscono dati storici in tempo reale sulle parole di ricerca. Con questo progetto, è anche possibile confrontare e prevedere l’andamento del campionato sportivo l’uno rispetto all’altro utilizzando tre modelli: tendenza più regressione della stagionalità, moltiplicativo di Holt-Winters (HWMM) e media mobile autoregressiva stagionale integrata (SARIMA). Le aziende interessate alla pubblicità o all’investimento in una delle due federazioni possono sfruttare queste previsioni per decidere quale lega sportiva fornisce il valore maggiore oa lungo termine.
Apprendimento delle serie temporali
Questo progetto mira a sviluppare metodi flessibili in grado di compilare, eseguire il backfill e prevedere serie temporali utilizzando un gran numero di set di dati di addestramento eterogenei. In questo caso, i set di dati che stiamo considerando consistono in misurazioni di serie temporali multivariate. Ciascuna di queste serie temporali ha parti mancanti; l’obiettivo è riempire le variabili di input mancanti utilizzando reti neurali profonde o soluzioni di reti neurali ricorrenti.