Týden 12
Osnova sekce
-
Téma: vícenásobná regrese.
Seznamte se s vícenásobnou regresí (tj. s lineární regresí s více vysvětlujícími proměnnými) podle kapitoly 12 v knize Statistická analýza závislostí s příklady v R (login/heslo = multi/variate). Důležitá je především:
1/ Interpretace směrnic (tj. regresních koeficientů) na straně 230.
2/ Testy nulovosti jednotlivých regresních koeficientů (str. 234 nahoře) a test nulovosti všech regresních koeficientů (tj. test hypotézy, že střední hodnota závisle proměnné nezávisí na vysvětlujících proměnných, "Regresní analýza rozptylu" na str. 234). Důležité je vědět, kde se tyto testy najdou v tabulce shrnující výsledky regresní analýzy (příklad na str. 234 dole). Poznámka: snadno lze testovat i hypotézy o lineárních kombinacích regresních koeficientů (které nás také někdy zajímají) --- to je popsané např. ve foliích k přednášce.
3/ Ověřování předpokladů funguje podobně jako v jednoduché regresi (tj. obvykle pomocí reziduí), ale je komplikovanější kvůli většímu počtu vysvětlujících proměnných (které mezi sebou mohou navíc různě záviset). Rezidua mohou být navíc ovlivněna vlivnými pozorováními, se kterými se seznámíme příští týden.
4/ Zábavná je sekce 12.5 (kvalitativní prediktor v modelu), která pomocí nula-jedničkových proměnných (které kódují hodnoty faktorové/kvalitativní proměnné) umožňuje snadno odhadovat zajímavé modely -- to je užitečné hlavně ve spojitosti s interakcemi v sekci 12.7.2, kde je pak možné odhadovat více regresních přímek najednou (tj. v jednom regresním modelu) a jednoduše testovat např. jestli mají všechny přímky stejný sklon nebo jestli jsou všechny přímky shodné (pomocí testu nulovosti příslušných regresních koeficientů - viz také obrázek 12.9 na straně 256).
5/ Podívejte se znovu na data police.txt a prozkoumejte výstup příkazů model1<-lm(react~height*weight+pulse,data=police); print(model1); summary(model1) --- rozmyslete si přitom význam jednotlivých čísel v počítačovém výstupu (hvězdička v příkazu lm() přidá do modelu i interakci váhy a výšky). Grafy různých typů reziduí (a dalších charakteristik) nejsnadněji získáte použitím príkazu plot(model1).Výklad v knize [Zvára: Regrese, Matfzypress] obsahuje podrobná odvození i důkazy, ale je organizovaná jiným způsobem -- testování různých hypotéz a odhadování parametrů v lineární regresi je popsané v prvních dvou kapitolách, následuje několik příkladů (kapitola 4 a 6), ověřování předpokladů (kapitoly 7 až 9), praktické postupy použitelné při sestavování modelu (kapitola 10), klasické postupy pro řešení problémů způsobené korelovanými vysvětlujícími proměnnými (kapitola 11), modely pro nula-jedničkové závislé proměnné (kapitola 11) a nelineární regrese (kapitoly 13 až 15).