Idősor előrejelzés ML modellekkel
2023-03-21
Lehetséges ML feladatok
Lehetséges ML Modellek
Adatok előkészítése
Adatok előkészítése - walk forward 1
Adatok előkészítése - walk forward 2
Lineáris modellek
Lineáris modellek
A lineáris regresszió széles körben használatos a gyakorlatban, és természetesen alkalmazkodik akár összetett előrejelzési feladatokhoz is.
A lineáris regressziós algoritmus megtanulja, hogyan készítsen súlyozott összeget a bemeneti jellemzőiből.
Két jellemző esetén a következő lenne:
cél = súly * feature_1 + súly * feature_2 + bias
Lineáris modellek
cél = súly_1 * feature_1 + súly_1 * feature_2 + bias
A képzés során a regressziós algoritmus megtanulja a súly_1, súly_2 és bias paraméterek értékeit, amelyek a legjobban illeszkednek a célértékhez.
Lineáris modellek és az idősor
Mivel a lineáris regresszió képes több FEATURE alapján előrejelző modellt képezni, igy egy megfelelő adat transzformációval az idősor előrejelzési probléma átalakítható egy felügyelt gépi tanulási problémára.
adatt = súly_1 * atadt-1 + súly_2 * atadt-2 + …… + súly_n * atadt-n + bias
Tehát egy walking forward (görgetett ablak) megoldással a múltbeli idő pillanatokat tekinthetjük úgy mint attribútumok, melyből ML model képezhető.
Lineáris modellek és az idősor
Az eddig használt idősor előrejelző modelljeink UNIVARIATE adatokkal dolgoztak, azonban az eddig megismert módszerekkel MULTIVARIATE feature halmazt is létrehozhatunk, amely segítheti a modell tanulását.
Ilyenek:
Lineáris modellek és az idősor
A MULTIVARIATE adatokat többféleképpen is felhasználhatjuk:
pl.: Cél = Szezon előrejelző + Trend előrejelző + Residual előrejelző
Lineáris modellek és az idősor
A lineáris modell-ek érzékenyek a következőkre:
Döntési fa alapú modellek
Döntési fa alapú modellek
A döntési fa alapú modellek jellemzően osztályozási feladatokban szerepelnek, viszont a legtöbb döntési fal alapú modell regressziós feladatokat is képes hatékonyan megoldani.
Ilyen esetben az idősorokat a regressziónál használt módon újra kell keretezni.
Azonban még a regresziónál működik a TRAIN/TEST split alapú tanulás addig a Döntési fáknál csak a WalkForward alapú megközelítés a járható út
Walkforward és a távoli előrejelzés problémája
Train/Test split
A walk forward módszer jól alkalmazható az idősorok TRAIN/TEST halmaz vágására.
Azonban azt figyelembe kell vennünk, hogy a “nagyon távoli jövőbe” a legtöbb modell nem képes előrejelezni.
Walk forward
Ennek egy megoldása, a állandóan előre toljuk, és újra tanítják a modellünket.
Multistep forecast
Multistep forecast
Multistep forecast
Felmerülhet bennünk a kérdés, hogy amennyiben csak EGY lépést jelzünk előre, akkor hogyan tudunk olyan modelleket építeni, melyek akár 2,3,6,12,24 lépésre is képesek előrejelzést végezni.
A megoldás többféleképpen is lehetséges:
Ismert múlt
előrejelzett érték
előrejelzett érték újrafelhasználása
Multistep forecast
A megoldás többféleképpen is lehetséges:
előrejelzett érték
Ismert múlt
Multistep forecast
előrejelzett érték
Ismert múlt
model1
model2
model3
model4