Il forecasting nell'era dell'IoT
di Galit Shmueli, National Tsing Hua University
Prevedere i valori futuri di una serie storica è un metodo di analisi dei dati antico e molto usato nel business e nell'industria. Dalle vendite trimestrali alla domanda mensile, fino alla pianificazione della capacità disponibile, le capacità predittive hanno un ruolo chiave in diversi settori aziendali, in particolare quando si tratta di programmare e valutare le operazioni. Nel moderno mondo dei big data, il forecasting si è esteso anche a settori nuovi, con nuovi usi, sfide e opportunità.
“Big data” nel contesto delle serie storiche si riferisce ad ampie raccolte di serie storiche, come per esempio quelle registrate da dispositivi per la misurazione dell'efficienza energetica o della qualità dell'aria. Questo genere di serie storiche oggi è più presente che mai grazie a nuovi sistemi di raccolta dati, trasferimenti rapidi e archiviazioni massicce a costo zero: dagli smartphone che registrano attivamente informazioni su ogni nostro comportamento all'Internet of Things (IoT), per cui ci sono dispositivi integrati nell'ambiente in cui viviamo quotidianamente e connessi a Internet, come i dispositivi per case intelligenti (es. termostati, macchine da caffè o aspirapolvere intelligenti), quelli da indossare (es. fitness band, scarpe da corsa), giocattoli, sensori ambientali (es. misuratori della qualità dell'aria, sensori del traffico) e simili. Alcune aziende ricevono anche ampie serie storiche da sensori che raccolgono dati come temperatura, umidità, velocità del vento per le pale eoliche o movimentazione degli oggetti e malfunzionamenti nei processi di produzione.
A differenza dell'analisi delle serie storiche, dove l'obiettivo è identificare i pattern principali di ogni serie e testare ipotesi relative a determinati parametri, la previsione delle serie storiche si concentra sui quello che deve ancora venire. Per questo, richiede un approccio di modellazione ben diverso. Sebbene esistano algoritmi di previsione, come ARIMA, che possono essere utilizzati sia nell'analisi sia nel forecasting, ci sono comunque differenze nel modo di applicarli e valutarli. Inoltre, fare previsioni richiede di prendere in considerazione problemi pratici relativi alla disponibilità dei dati al momento dell'implementazione, velocità di implementazione e livelli di automazione richiesti e potenziale uso dei dati ottenuti, considerato che in genere le previsioni portano a compiere determinate azioni.
Sebbene il volume di dati delle serie storiche sia in aumento, spesso ne serve solo una porzione molto ridotta per prevedere valori di interesse futuro o per individuare pattern utili nei dati. Spesso, molte delle nuove fonti di big data hanno una frequenza molto più elevata: anziché a cadenza trimestrale, mensile o settimanale, molte serie storiche sono disponibili minuto per minuto o addirittura secondo per secondo. Tuttavia, i dati necessari per fare previsioni utili o individuare pattern di approfondimento potrebbero essere molto contenuti. Per esempio, per esplorare i dati dei sensori in un processo di produzione al fine di anticipare eventuali guasti, bisognerà iniziare da un campione e sperimentare periodicità diverse (per minuto, all'ora, al giorno, eccetera, a seconda della frequenza con cui vengono raccolti i dati).
La pervasività dei dispositivi IoT ha fatto sì che ci siano serie storiche in abbondanza in molte aree diverse, dove le previsioni possono essere molto utili per decidere come agire, pianificare o fare valutazioni.
Avendo insegnato forecasting negli Stati Uniti, in India, a Taiwan e online per gli ultimi 15 anni, ho potuto assistere di persona all'aumento dei dati delle nuove serie storiche e a come le aziende hanno iniziato a usare le previsioni per raggiungere nuovi obiettivi. I miei studenti lavorano in gruppo su problemi aziendali reali, in collaborazione con imprese che vanno da startup a grandi multinazionali nell'industria dei servizi e nell'economia collaborativa. I nostri primi progetti erano incentrati sulla previsione di una manciata di dati di vendita con cadenza mensile o trimestrale, mentre i progetti degli anni più recenti si sono orientati più su ampie raccolte di serie storiche, dati con maggiore frequenza, tassi di aggiornamento elevati e/o nuovi tipi di dati. Esempi di applicazione del forecasting:
• Quantità di clienti previsti per il giorno successivo in ogni sede di una catena di ristoranti.
• Traffico giornaliero da pagine dei fan su Facebook.
• Richiesta di centinaia di confezioni di bevande personalizzate da parte dei clienti.
• Domanda mensile di centinaia di ricambi automobilistici diversi.
• Numero giornaliero di segnalazioni di problemi di utenza in un'istituto di didattica online.
• Disponibilità oraria di parcheggio nei parcheggi di un'azienda taiwanese.
• Uso/Numero di clienti in aeroporti, voli, taxi condivisi e biciclette.
Un'ulteriore indicazione della variazione nel tipo e nel volume dei dati è data dalla Competizione M, una competizione di forecasting di serie storiche iniziata nel 1982 (sotto la guida del ricercatore Spyros Makridakis) e intesa a valutare e confrontare la precisione di diversi metodi di previsione. La competizione del 1993 ha registrato 29 serie mensili, mentre in quella del 2020 c'erano ben 100 000 serie storiche gerarchiche giornaliere di Walmart, a partire dal livello di SKU.
Come vengono applicati gli algoritmi di previsione in questi casi? Rispetto a uno scenario con poche serie storiche in cui le previsioni vengono generate una sola volta, oggi servono algoritmi di previsione in grado di funzionare in maniera efficiente ed efficace su ampie raccolte di serie storiche in maniera continuativa (per un aggiornamento continuo). Gli algoritmi veloci e flessibili (es. metodi di smoothing esponenziale e modelli di regressione lineare) sono molto utili in questo senso. Inoltre, per una migliore efficienza bisogna disporre di un software sufficientemente potente da applicare più algoritmi di previsione a diverse serie, oltre che da automatizzare il processo per eseguirlo nuovamente e ottenere nuove previsioni ogni volta che arrivano nuovi dati. JMP è dotato di tutte queste funzionalità, poiché è in grado di implementare una serie di algoritmi di smoothing esponenziale da adattare a un'ampia raccolta di serie storiche, selezionando il modello "migliore" per ognuna.
Per concludere, il forecasting oggi è largamente presente nel business e nell'industria, dai prodotti ai servizi, dalle startup alle multinazionali. La pervasività dei dispositivi IoT ha fatto sì che ci siano serie storiche in abbondanza in molte aree diverse, dove le previsioni possono essere molto utili per decidere come agire, pianificare o fare valutazioni. Le esigenze di previsione delle aziende moderne spesso richiedono di produrre previsioni rapide per diverse serie su base continuativa. Una serie storica può contenere ulteriori informazioni, come dati gerarchici o trasversali. I metodi migliori per ottenere previsioni in questi sistemi e valutarne il rendimento sono l'oggetto della ricerca nel campo del forecasting.
JMP Foreword
Teniamoci in contatto!
Accetto di essere contattato via e-mail per conoscere novità, eventi e offerte di JMP. Comprendo di poter ritirare il mio consenso in qualsiasi momento.