Zápočtový úkol 2
Motivace
Druhý úkol je vlastně složitější variantou prvního úkolu. Cílem je předvést analýzu s použitím multi-level modelů. Nebudete muset používat frekventistickou analýzu, stačí používat brms
.
Úkol nemá být složitý, cílem je zopakovat si kroky, které jsme se učili v rámci seminářů. Obtížnost si můžete sami přizpůsobit volbou problému a detailností analýzy.
Zadání
Najděte si volně dostupný dataset1. Ideálně některý z dostupných datasetů v R, ale můžete hledat i na OSF. Pokud budete používat data z internetu, váš program by si je měl sám stáhnout.
Vyberte si jednoduchý problém nad zvoleným datasetem. Problém by měl být testovatelný pomocí multi-level (mixed-effect modelu) - měl by tedy pracovat s prediktory (fixed effects) a používat nějakých informací o skupinách v datech (random effects), např. že se jedná o opakovaná měření od stejného člověka nebo že se jedná o podskupinu nějakého clusteru (hierarchický model).
Problém analyzujte pomocí bayesovské analýzy. Postupujte pomaleji a jednotlivé kroky komentujte. Zamyslete se nad volbou priors. Interpretujte odhad parametru (HPDI, credible interval). Pokuste se vizualizovat výsledek modelu (posterior distribution a/nebo posterior predictive distribution).
Ukažte, zda/jak dochází ve vašem modelu k partial pooling (shrinkage).
Výsledek ve formě .qmd (zdrojový kód2) i .html (výsledná podoba) nahrajte do Moodlu do konce června.
- Používejte seed v zadání
brm
, aby váš kód byl replikovatelný. - Váš kód by neměl instalovat žádné balíčky. Pokud budete používat balíčky, u kterých si nebudete jisti, zda jsou běžně nainstalovány, vypište je na začátek reportu.
- Je v pořádku, pokud bude váš report v .html “neučesaný” (bude vidět pomocný kód, neformátovaný výstup, bez zaokrouhlování apod.). Výpočet (kód
brms
apod.) by vidět být měl. - Pokud budete chtít, pomocné části můžete skrýt pomocí
echo=FALSE
. Nastavení#| results: hide
v .qmd neboresults="hide"
v .Rmd skryje dlouhý výstup zbrm
.
- Používejte seed v zadání
Ať vám to dobře jde!
Footnotes
Například http://www.sthda.com/english/wiki/r-built-in-data-sets nebo https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00Index.html Většina datasetů v R obsahuje jednoduchou dokumentaci (
?iris
). Nepoužívejte datasety zrethinking
nebobrms
.↩︎Můžete používat Quarto (.qmd jako na semináři) nebo RMarkdown (.Rmd)↩︎