1 of 11

Regresszió

2022-11-15

2 of 11

Regresszió

  • A regresszió is felügyelt gépi tanulási feladat, azaz rendelkezésre áll egy tanító adatbázis, ami alapján egy modellt kell tanulnunk, ami utána korábban nem látott egyedekre is képes predikálni.
  • Az osztályozási feladatnál a célváltozó egy osztály/kategória címke, addig a regressziónál a célváltozó egy folytonos érték.

3 of 11

4 of 11

Regresszió

  • Megjegyezzük, hogy a gépi tanulás regresszió feladata nagyon hasonlít a statisztika regresszió analízis feladatához.
  • Míg azonban a statisztikában az az egyetlen célunk, hogy jellemezni tudjunk egy adathalmazt, a gépi tanulásnál ismeretlen egyedeken való minél pontosabb predikció a cél, amihez általánosítási készségre is szükség van.

5 of 11

Kiértékelési metrikák a regressziós feladatnál

  • Mivel a regresszió is felügyelt gépi tanulási feladat, ezért a kiértékelés módszertana megegyezik az oszályozási feladatéval.

  • Azaz tanító és kiértékelő adatbázisra bontjuk a címkézett athalmazunkat, a tanító adatbázison tanítunk egy modellt és az elkülönített kiértékelő adatbázison mérjük a modell pontosságát/teljesítményét.

6 of 11

Kiértékelési metrikák a regressziós feladatnál

  • Azonban a találati arány és pontosság+fedés kiértékelési metrikák nem értelmezhetőek folytonos célváltozó predikciójánál, a regressziós feladathoz speciális kiértékelési metrikát kell választanunk.

  • A regressziós feladatoknál leggyakrabban használt kiértékelési metrika az átlagos négyzetes hiba (mean squared error, MSE).

7 of 11

Gépi tanulási algoritmusok regresszióra

  • lineáris regresszió
  • regressziós döntési fák
  • regressziós knn

8 of 11

Lineáris regresszió

  • Lineáris regresszió esetén egyetlen diszkriminancia függvényt tanulunk és annak kimenete lesz a predikciónk.

y= ax + b

9 of 11

Lineáris regresszió

  • Lineáris regresszió esetén egyetlen diszkriminancia függvényt tanulunk és annak kimenete lesz a predikciónk.

https://mlu-explain.github.io/linear-regression/

Lehetne több tag is….

y= a1x1 + a2x2 + a3x3+…. b

y= ax + b

Hogyan is működik….

10 of 11

Regressziós döntési fák

  • A regressziós döntési fa modellje szintén egy döntési fa, ami a jellemzők közötti logikai kapcsolatot írja le. A osztályozt végző döntési fához képest az eltérés a leveleken van. A regressziós döntési fa leveleiben vagy egy konstans érték vagy egy lineáris regressziós modell (minden levelén különböző modell) van.

https://mlu-explain.github.io/decision-tree/

11 of 11

Regressziós knn

  • A k legközelebbi szomszéd osztályozót is használhatjuk regresszióra.
  • Itt is meg kell adnunk egy egyedek közti távolság/hasonlóság függvényt, ami alapján predikciós időben az ismeretlen egyedhez, a tanító adatbázisbeli k legközelebbi egyedet megkeresi az algoritmus.
  • A tanító adatbázbeli szomszédokhoz most folytonos érték van rendelve (célváltozó).
  • A regressziós kNN a k szomszéd tanító adatbázis célértékének átlagát - vagy hasonlósággal súlyozott átlagát - fogja predikálni.

http://www.inf.u-szeged.hu/~rfarkas/ML20/knn.html

https://www.javatpoint.com/k-nearest-neighbor-algorithm-for-machine-learning