Regresní model pro reakční dobu
Použitím doporučeného postupu pro sestavení regresního modelu (sekce 12.3 v knize Statistická analýza závislostí s příklady v R ) najděte rozumný regresní model, který bude přiměřeně dobře vysvětlovat reakční dobu (můžete přitom uvažovat i nové proměnné, např. BMI a různé transformace proměnných i jejich interakce).
Okomentujte, které vysvětlující proměnné mají statisticky signifikantní vliv na reakční dobu? Jaká je interpretace jednotlivých regresních koeficientů? Co znamenají čísla uvedená v počítačovém výstupu?
Na základě grafů reziduí (v R: plot(lm(....))) a vypočtených charakteristik pro detekci vlivných pozorování (v R: influence.measures(...)) najděte pozdezřelá (vlivná nebo odlehlá) pozorování a okomentujte splnění (nebo nesplnění) předpokladů lineárního regresního modelu.
Rozmyslete si, jak by se lišily předpovědi získané metodami strojového učení?