Cos’è la previsione statistica?
Tutti fanno previsioni, che lo sappiano o meno. Le aziende devono prevedere eventi futuri per pianificare la produzione, pianificare la propria forza lavoro o preparare anche il piano aziendale più semplice.
La maggior parte delle previsioni aziendali è ancora giudicante e intuitiva. A volte questo è appropriato. Le persone devono integrare le informazioni provenienti da una grande varietà di fonti, qualitative e quantitative, e questo è probabilmente meglio farlo utilizzando le straordinarie capacità di riconoscimento dei modelli del cervello umano. Sfortunatamente, molte aziende utilizzano anche previsioni giudicanti dove non dovrebbero.
Non tutti capiscono il concetto di previsione. Tende a confondersi con la definizione degli obiettivi. Se un’azienda chiede ai suoi venditori di prevedere le vendite per i loro territori, queste “previsioni” diventano spesso i parametri con cui vengono giudicati.
Il vantaggio principale della previsione statistica è che separa il processo di previsione da quello di definizione degli obiettivi e lo rende sistematico e obiettivo. Le previsioni statistiche possono aiutare quasi tutte le aziende a migliorare la pianificazione e le prestazioni. C’è, in altre parole, un valore aggiunto per un’impresa.
Il futuro è incerto, e questa incertezza può essere rappresentata quantitativamente. La previsione statistica rappresenta l’incertezza attraverso una distribuzione di probabilità. Una distribuzione di probabilità associa ogni possibile risultato alla probabilità che si verifichi. Sono necessari due tipi di informazioni per descrivere la distribuzione: le previsioni puntuali, che è essenzialmente la stima “migliore ipotesi”, e il limite di confidenza, che cattura quanta incertezza c’è intorno alla previsione puntuale. I limiti di confidenza superiore e inferiore rappresentano limiti ragionevoli per la previsione. Puoi essere ragionevolmente sicuro che il risultato effettivo rientrerà nei limiti di confidenza.
Forecast Pro rappresenta queste informazioni graficamente, oltre che numericamente. Nel grafico sottostante, la linea rossa rappresenta la previsione puntuale, mentre le linee blu rappresentano i limiti di confidenza superiore e inferiore.
Il limite superiore di confidenza è spesso calibrato sul novantacinquesimo percentile. Ciò significa che il valore effettivo dovrebbe scendere al limite di confidenza superiore o al di sotto del 95% delle volte. È possibile impostare i percentili dei limiti di confidenza superiore e inferiore. A volte, il limite di confidenza superiore sarà più utile per la pianificazione rispetto alla previsione puntuale.
Illustriamo questa idea con un esempio. Supponiamo che tu sia responsabile della previsione delle vendite dei widget per la tua azienda. Se si volesse determinare i ricavi previsti per il mese prossimo, si sarebbe più interessati alla previsione puntuale, poiché è il valore medio della distribuzione. La previsione puntuale fornisce l’errore di previsione minimo previsto.
D’altra parte, supponiamo che tu voglia sapere quanti widget produrre. Se si sovrapproduce, i costi di stoccaggio saranno eccessivi. Ma se produci poco, probabilmente perderai vendite. Poiché il costo delle vendite perse è solitamente maggiore del costo dell’eccesso di scorte, sarai più interessato al limite massimo di confidenza. Il limite di confidenza superiore del 95% indica quanti widget produrre per limitare la possibilità di “fare scorte” a meno del 5%.
Metodologie di previsione
È disponibile un’ampia varietà di tecniche di previsione statistica, che vanno da molto semplici a molto sofisticate. Tutti cercano di catturare la distribuzione statistica che abbiamo appena discusso.
Forecast Pro offre le metodologie di previsione che si sono dimostrate le più appropriate per le previsioni aziendali:
– medie mobili semplici,
– modelli di dati discreti (Poisson o binomio negativo),
– adattamento della curva,
– il modello della domanda intermittente di Croston,
– livellamento esponenziale,
– Box-Jenkins,
– Modello di diffusione dei bassi,
– previsioni per analogia,
– regressione dinamica,
– modelli di eventi e
– previsione a più livelli.
L’ultima versione di Forecast Pro include anche l’aumento del gradiente estremo, una metodologia di apprendimento automatico che è recentemente emersa come molto efficace per la previsione della domanda.
Tutte queste metodologie prevedono il futuro adattando modelli quantitativi a modelli statistici del passato. Pertanto, è necessario disporre di record storici delle variabili, preferibilmente per diversi anni.
L’accuratezza delle previsioni dipende dal grado di esistenza dei modelli di dati statistici e dalla loro stabilità nel tempo. Più regolare è la serie, più accurate sono le previsioni.
Sei delle metodologie sono tecniche univariate. Prevedono il futuro interamente da modelli statistici del passato.
La media mobile semplice è ampiamente utilizzata nel mondo degli affari, soprattutto perché è così facile da implementare.
Tuttavia, è appropriato solo per set di dati molto brevi o molto irregolari, in cui caratteristiche statistiche come la tendenza e la stagionalità non possono essere determinate in modo significativo.
I modelli di dati discreti vengono utilizzati per i dati costituiti da piccoli numeri interi. Questi modelli sono tipicamente utilizzati per modellare un articolo a movimento lento per il quale la maggior parte degli ordini sono per un solo pezzo alla volta. Le previsioni sono non di tendenza e non stagionali.
Il modello di domanda intermittente di Croston non è una tecnica ampiamente conosciuta o utilizzata, ma può essere estremamente utile. Di solito viene utilizzato per modellare i dati in cui un numero significativo di periodi ha una domanda pari a zero, ma gli ordini diversi da zero possono essere sostanziali. Questa è la caratteristica di un articolo che si muove lentamente a cui viene ordinato di rifornire un inventario a valle. Le previsioni sono non di tendenza e non stagionali.
I modelli di livellamento esponenziale sono ampiamente applicabili. Sono anche ampiamente utilizzati per la loro semplicità, precisione e facilità d’uso. La loro robustezza li rende ideali anche quando i dati sono brevi e/o volatili. I modelli di smoothing esponenziale stimano la tendenza e la stagionalità e li estrapolano in avanti.
Box-Jenkins è un metodo statistico più elaborato del livellamento esponenziale. I modelli Box-Jenkins stimano le correlazioni storiche dei dati e le estrapolano in avanti. Spesso supera lo smoothing esponenziale nei casi in cui i dati sono abbastanza lunghi e non volatili. Tuttavia, potrebbe non funzionare bene quando i dati sono instabili.
L’apprendimento automatico è disponibile come modello univariato e può essere incluso nell’algoritmo di selezione degli esperti, se lo si desidera. Come lo smoothing esponenziale e Box-Jenkins, i modelli univariati di apprendimento automatico sfruttano le informazioni inerenti ai dati storici (stagionalità, tendenza) per creare funzionalità. Utilizzando XGBoost, un algoritmo di potenziamento del gradiente estremo, queste funzionalità vengono utilizzate per creare un insieme di alberi decisionali per generare previsioni. Il modello di apprendimento automatico automatico di Forecast Pro sfrutta il nostro algoritmo di selezione degli esperti basato sull’intelligenza artificiale per selezionare le funzionalità e una specifica del modello ad albero che aumenta il gradiente estremo appropriata per i tuoi dati.
La selezione di esperti di Forecast Pro sceglie automaticamente la tecnica di previsione univariata appropriata per ogni elemento previsto. Per impostazione predefinita, la selezione degli esperti determinerà quale dei primi cinque modelli univariati è più appropriato per i dati, ottimizzerà il modello e creerà le previsioni. Se lo si desidera, è possibile includere anche l’apprendimento automatico nella selezione degli esperti. In alternativa, è possibile imporre l’utilizzo di un metodo specifico e personalizzare i modelli. Forecast Pro fornisce test diagnostici e statistici completi per aiutarti a prendere decisioni informate.
Forecast Pro include sei tecniche di previsione aggiuntive che non sono considerate nella selezione degli esperti:
– modelli di eventi,
– modelli di componenti personalizzati,
– previsioni per analogia,
– il modello di diffusione dei bassi,
– regressione dinamica
– e modelli di machine learning personalizzati.
I modelli di eventi sono estensioni dei modelli di smoothing esponenziale che consentono di acquisire risposte a promozioni, interruzioni dell’attività e altri eventi a-periodici. Questi modelli consentono di assegnare ogni periodo in categorie logiche e incorporare un aggiustamento per ogni categoria. Ad esempio, se si stabilisce una categoria per i periodi promossi, il modello includerà un aggiustamento per i periodi promossi. Se hai eseguito tre diversi tipi di promozioni, puoi stabilire tre categorie e avere un adattamento diverso per ogni tipo di promozione.
I modelli di componenti personalizzati sono anche estensioni dei modelli di arrotondamento esponenziale. Il metodo genera previsioni statistiche per le diverse componenti trovate in un modello di livellamento esponenziale (livello di vendita, tendenza, andamento stagionale ed eventi) e consente quindi di personalizzare qualsiasi componente stimata.
Il modello è molto utile in circostanze in cui non tutti i componenti possono essere stimati con precisione dalla cronologia della domanda. Gli esempi includono brevi set di dati in cui il modello stagionale non può essere stimato in modo affidabile e si desidera utilizzare un modello stagionale da un prodotto simile, prevedendo l’impatto di eventi futuri che non si sono verificati storicamente, temperando la tendenza per previsioni a lungo termine, ecc.
La previsione per analogia è una nuova tecnica di previsione del prodotto che consente di creare una previsione che “assomiglia” al modello di domanda di un prodotto diverso o a un profilo di lancio creato.
Il modello di diffusione Bass è una nuova tecnica di previsione del prodotto progettata per prevedere la diffusione di un nuovo prodotto in base ai tassi di adozione di due tipi di utenti: gli innovatori che sono guidati dal loro desiderio di provare nuovi prodotti e gli imitatori che sono principalmente influenzati dal comportamento dei loro pari.
La regressione dinamica produce una previsione basata sulla cronologia dell’elemento previsto (come i metodi univariati) e su quella delle variabili esplicative (ad esempio, promozione del prodotto, pubblicità, variabili demografiche o indicatori macroeconomici). È necessario fornire valori cronologici per la variabile da prevedere e le variabili esplicative.
Forecast Pro può fornire la selezione automatica per i termini dinamici (ad esempio, variabili dipendenti ritardate e termini Cochrane-Orcutt), ma l’utente deve specificare quali variabili esplicative includere nel modello. Forecast Pro fornisce diverse batterie di prova e diagnostica per la selezione delle variabili e fornisce consigli specifici su come migliorare il modello. La costruzione di un modello di regressione dinamica consiste quindi nel decidere quali variabili considerare e seguire i consigli del programma, passo dopo passo, per identificare il modello finale.
La regressione dinamica può sovraperformare lo smoothing esponenziale e Box-Jenkins nei casi in cui esistono forti variabili esplicative e si dispone di previsioni ragionevolmente accurate per esse. Sfortunatamente, questo non è sempre il caso, e in quei casi le previsioni potrebbero non essere accurate come quelle dei metodi univariati.
I modelli di Machine Learning personalizzati possono anche includere pianificazioni di eventi e variabili esplicative come funzionalità in un modello di insieme di alberi decisionali potenziato. Come per i modelli di eventi e la regressione dinamica, è necessario fornire valori cronologici per eventi e variabili esplicative.
Come i modelli di apprendimento automatico di Forecast Pro, la nostra metodologia di apprendimento automatico personalizzata utilizza XGBoost, un algoritmo di potenziamento del gradiente estremo, per creare un insieme di alberi decisionali.
L’algoritmo di apprendimento automatico di Forecast Pro selezionerà automaticamente le funzionalità più rilevanti sia da quelle fornite dall’utente che dalle funzionalità generate da Forecast Pro. Puoi addestrare automaticamente modelli di Machine Learning personalizzati usando la stessa logica basata sull’intelligenza artificiale che alimenta i modelli univariati di Machine Learning automatico di Forecast Pro oppure puoi specificare una struttura specifica dell’albero decisionale potenziato.
Se sei nuovo alle previsioni e queste tecniche sembrano un po ‘intimidatorie, non preoccuparti. Abbiamo progettato Forecast Pro per guidarti completamente attraverso il processo di previsione. Basta seguire i consigli del programma e presto genererai previsioni accurate e aggiungerai valore alla tua attività.
Alcuni consigli di previsione
Forecast Pro utilizza la cronologia dei dati per prevedere il futuro, quindi è estremamente importante che i dati siano il più accurati e completi possibile. Tieni a mente la regola, “spazzatura dentro, spazzatura fuori!”
Dovrai anche pensare a quali dati dovresti prevedere. Se vuoi prevedere la domanda per il tuo prodotto, probabilmente dovresti inserire e prevedere gli ordini in arrivo piuttosto che le spedizioni, che sono soggette a ritardi di produzione, effetti di stoccaggio, pianificazione della manodopera, ecc. Molte aziende stanno facendo grandi investimenti per ottenere dati il più vicino possibile alla domanda reale.
Più dati puoi fornire al programma, meglio è! Il programma può funzionare con un minimo di cinque punti dati, ma le previsioni di serie molto brevi sono semplicistiche e meno accurate. Sebbene la raccolta di dati aggiuntivi possa richiedere un certo sforzo, di solito ne vale la pena.
Se i tuoi dati sono stagionali, è particolarmente importante disporre di una lunghezza adeguata dei dati. Gli algoritmi di selezione automatica dei modelli in Forecast Pro non prenderanno in considerazione i modelli stagionali a meno che tu non abbia “almeno due anni” di dati. Questo perché sono necessari almeno due campioni per ogni mese o trimestre per distinguere la stagionalità dai modelli irregolari una tantum. Idealmente, è consigliabile utilizzare tre o più anni di dati per creare un modello stagionale.