1 of 21

Egy folytonos változó jellemzése

Krajcsi Attila

2 of 21

Adatsor és pontdiagram

  • Ez a teljes elérhető információ
  • Minden más az egyes fontos jellemzők megállapítása
    • (1) Egyes lényegi tulajdonság kiemelése
      • Ugyanez pszichológiában: gibsoni elv
    • (2) “Új” információ létrehozása
    • (3) Egyben információ vesztés is
    • Mindez pszichológiában: mi a kiemelés, és mi “csak” szűrés?

3 of 21

Minta és populáció

  • Többnyire a populációra vagyunk kíváncsiak, de csak egy részét (mintát látjuk)
  • A minta alapján mit mondhatunk a populációról?
  • A statisztikák értelmezhetőek a mintára, és értelmezhetőek a populációra
    • Populáció becslésében lehet pontbecslés (legvalószínűbb érték) vagy intervallum becslés (tartomány, ahol a legvalószínűbb az érték)

4 of 21

A minta jellemzése

5 of 21

Eloszlás és dobozdiagram

  • Eloszlás
    • Alapja: a mért változó egyenlő tartományai
    • Függ a kategóriák szélességétől
    • A "sűrűbb" régiók alakulása jobban látszik
  • Dobozdiagram
    • Alapja: a mért esetek egyenlő elemszámú csoportjai
    • Medián, alsó és felső kvartilis, minimum és maximum
    • Kilógó extrém értékek

6 of 21

Elemszám

  • A populáció becslése miatt fontos
  • Mennyire megbízható az adatunk
    • Populációbecslést javítja a magasabb elemszám
  • Szignifikanciához hatás nagysággal egyszerre informatív
    • Pl. 3 elemszámú vizsgálat
    • vs. kompenzálás nagy elemszámmal

7 of 21

Középértékek

  • Pl. átlag, medián
  • Különlegessége
    • Ez csak egy jellemzője a teljes eloszlásnak, de az egyik leggyakrabban használt

8 of 21

Átlag

  • Egyik középérték
  • Egyik oka a használatának egyfajta redundancia: az értékhez közeli adatok a jellemzőek
  • Másik ok
    • Nem feltétlenül a legtipikusabb érték, vagy akár a környéke - pl. kétcsúcsú eloszlás
    • Inkább a skálán való pozíciója az érdekes - pl. átlag változás csak az eloszlás “elcsúszásával” foglalkozik, az eloszlás más változásával nem
  • Átlagtól távoli, ritka értékek erősebben “mozgatják” az átlagot, mint az átlaghoz közeli, gyakoriak

9 of 21

Medián

  • Másik középérték
  • Használható ordinális változókra
    • Használható magasabb mérési szintűekre is
      • Többszörös hiba RI medián számolásnál nem parametrikus statisztikát kérni (egyik lektorunk)
  • Nem feltétlenül a legtipikusabb érték - pl. kétcsúcsú eloszlás

10 of 21

Medián - folytatás

  • Mediántól távolabbi, “ritkább” értékek nem “mozgatják” erősebben, mint a mediánhoz közeli, “gyakori” értékek
    • RI esetében (ami erősen ferde eloszlású) kevésbé zajos az átlaghoz képest

11 of 21

Módusz

  • A teljes eloszlásnak egyetlen értéke
  • Nem sok mindenre jó
    • Nominális változónál nincs jellemző érték körüli csoportosulás, mert nincs kapcsolat az értékek közt
      • A teljes eloszlásnak egyik értéke, de nem sokkal informatívabb, mint a többi érték
    • Ordinális vagy folytonos változóknál függ a kategória szélességtől is

12 of 21

Szóródás

  • Szóródás (jellemző értéktől mennyire tér el)
  • Legtöbb vizsgálatban a változó középértékének változása érdekel, de néha a szóródás változása lehet érdekes
  • Amikor a középérték érdekel minket, akkor ez a zaj
    • Ez lehet a zaj mértékének mutatója is
    • Egyben a populáció becslésének jóságának is egy komponense

13 of 21

Szóródási mutatók

  • Szórás
  • Terjedelem és félterjedelem
    • Terjedelem függ a kilógó adatoktól
    • Félterjedelem hasonló módon kevéssé függ az outlierektől a szóráshoz képest, mint a medián az átlaghoz képest

14 of 21

Ferdeség és csúcsosság

  • Normalitás megállapításához
  • Máskor nem nagyon érdekes a kutatásban

15 of 21

Egyéb egzotikus tulajdonságok

  • Pl. reakcióidőnél ex-gauss illesztés

16 of 21

Skála standardizálása

  • Standard pont (normál pont, z pont)
    • Skála transzformációja, hogy 0 legyen az átlag és 1 a szórás
    • Különböző skálák így összevethetőek
  • Variációs együttható (relatív szórás)
    • Szórás/átlag
    • A szórások összehasonlíthatóak
  • Normál eloszlásnál

17 of 21

A populáció jellemzése

18 of 21

Pontbecslés

  • Időnként egyszerű a helyzet: a populáció pontbecslése ugyanaz az érték, mint a minta értéke, pl. átlag
  • Időnként a képlet eltér, pl. szórás

19 of 21

Átlag konfidencia intervalluma

  • Befolyásolja:
    • Szórás (nagy növeli)
    • Minta elemszáma (nagy csökkenti)
    • Konfidencia szint (nagy növeli)
  • A szórást a zaj csökkentésével tudjuk csökkenteni
  • Egymintás t-próba erre épül

20 of 21

Normalitás vizsgálat

  • Sok hipotézis vizsgálatnak feltétele a normál eloszlás

21 of 21

Eljárások normalitás vizsgálatára

  • Leíró adatok alapján, pl. ferdeség
    • Nem tudjuk, mennyire megbízható
    • A küszöbérték önkényes
  • Hipotézis tesztek
    • Nagy elemszámnál szinte semmi nem lesz normál eloszlású
    • Némelyik nagy elemszámot igényel
    • Kognitív kutatásban tipikus kis elemszámok sosem szignifikánsak
  • Vizuális vizsgálat, hogy az alfa ne inflálódjon
    • Ismeretlen matematikai tulajdonságú