Regresione analize u programu SPSS
Miloš Bojičić
Kancelarija za obezbeđenje kvaliteta
Univerzitet u Beogradu
Regresiona analiza
Regresiona jednačina:
Regresiona jednačina
y = a + bx
y - zavisna promenljiva,
a - konstanta,
b - koeficijent nagiba,
x – nezavisna promenljiva.
Konstanta a, i koeficijent nagiba b, takođe se nazivaju regresionim koeficijentima. Koeficijent nagiba b predstavlja veličinu porasta zavisne varijable y, za jediničnu promenu nezavisne varijable x!
Osobine parametra b
Ciljevi regresione analize
Pretpostavke za jednostanvnu (bivarijatnu) linearnu regresiju
3. Postojanje linearne veze između prediktorske i kriterijumske varijable
Nacrtan je dijagram raspršenja koncentracije holesterola u odnosu na prosečno dnevno vreme provedeno gledajući TV. Vizuelnim pregledom ovog dijagrama uočena je linearna veza između varijabli.
Alternative u slučaju neliearne veze:
1. Sprovođenje transformacija
2. Polinomna regresija
3. Nelinearna regresija
5. Nepostojanje značajnih autlejera
Ako je data set veliki, osim grafičkog prikaza možete koristiti Casewise diagnostics Tabela se generiše samo ukoliko je zadovoljen zadati kriterijum! Rešenja za netipične tačke:
| |
| |
| |
| |
| |
| |
4. Nezavisnost opservacija
Alternativa – analiza vremenskih serija (time series analysis)
Utvrđena je nezavisnost reziduala, što je procenjeno pomoću Durbin-Vatsonovog testa čija je vrednost 1,913.
6. Testiranje homoskedastičnosti
Alternative:
Utvrđena je homoskedastičnost, što je procenjeno vizuelnim pregledom dijagrama standardizovanih reziduala u odnosu na standardizovane predviđene vrednosti.
7. Testiranje normalnosti
Reziduali su bili normalno raspoređeni, što je procenjeno vizuelnim pregledom dijagrama verovatnoće normalne raspodele.
Rezultati
cholesterol = b0 + (b1 x time_tv)
cholesterol = -0.944 + (0.037 x time_tv)
predicted cholesterol concentration = -0.944 + (0.037 x 180) = 5.72 mmol/L
Izveštavanja
Izveštavanja
Izvršena je linearna regresija kako bi se razumeo uticaj prosečnog dnevnog vremena provedenog gledajući TV na koncentraciju holesterola. Da bi se procenila linearnost, nacrtan je dijagram raspršenja koncentracije holesterola u odnosu na prosečno dnevno vreme gledanja TV-a, sa nacrtanom regresionom linijom. Vizuelnim pregledom ovih dijagrama uočena je linearna veza između varijabli. Postojala je homoskedastičnost i normalnost reziduala. Jedan učesnik je identifikovan kao autlajer sa koncentracijom holesterola od 7,98 mmol/L. On je uklonjen iz analize jer nije predstavljao ciljnu populaciju.
Jednačina predviđanja glasi:
koncentracija holesterola = -0,94 + 0,03697 × vreme
Prosečno dnevno vreme gledanja TV-a statistički značajno predviđa koncentraciju holesterola, F(1, 97) = 14,39, p < .001, objašnjavajući 12,9% varijacije u koncentraciji holesterola sa prilagođenim R² = 12,0%, što predstavlja srednje veliki efekat prema Cohenu (1988). Svaka dodatna minuta prosečnog dnevnog vremena gledanja TV-a dovodi do povećanja koncentracije holesterola za 0,037 mmol/L, 95% CI [0,018, 0,056].
Predviđanja su izvršena kako bi se odredila prosečna koncentracija holesterola kod osoba koje su dnevno gledale prosečno 160, 170 i 180 minuta TV-a:
Pretpostavke
Multipla linearna regresija
predicted VO2max = b0 + (b1 x age) + (b2 x weight) + (b3 x heart_rate) + (b4 x gender)
predicted VO2max = 87.83 – (0.165 x age) – (0.385 x weight) – (0.118 x heart_rate) + (13.208 x gender)
predicted VO2max = 87.83 - (0.165 x 30) - (0.385 x 80) - (0.118 x 133) + (13.208 x 1) = 49.59 ml/min/kg