Zápočtový úkol 2

Motivace

Druhý úkol je vlastně složitější variantou prvního úkolu. Cílem je předvést analýzu s použitím multi-level modelů. Nebudete muset používat frekventistickou analýzu, stačí používat brms.

Úkol nemá být složitý, cílem je zopakovat si kroky, které jsme se učili v rámci seminářů. Obtížnost si můžete sami přizpůsobit volbou problému a detailností analýzy.

Zadání

  1. Najděte si volně dostupný dataset1. Ideálně některý z dostupných datasetů v R, ale můžete hledat i na OSF. Pokud budete používat data z internetu, váš program by si je měl sám stáhnout.

  2. Vyberte si jednoduchý problém nad zvoleným datasetem. Problém by měl být testovatelný pomocí multi-level (mixed-effect modelu) - měl by tedy pracovat s prediktory (fixed effects) a používat nějakých informací o skupinách v datech (random effects), např. že se jedná o opakovaná měření od stejného člověka nebo že se jedná o podskupinu nějakého clusteru (hierarchický model).

  3. Problém analyzujte pomocí bayesovské analýzy. Postupujte pomaleji a jednotlivé kroky komentujte. Zamyslete se nad volbou priors. Interpretujte odhad parametru (HPDI, credible interval). Pokuste se vizualizovat výsledek modelu (posterior distribution a/nebo posterior predictive distribution).

  4. Ukažte, zda/jak dochází ve vašem modelu k partial pooling (shrinkage).

  5. Výsledek ve formě .qmd (zdrojový kód2) i .html (výsledná podoba) nahrajte do Moodlu do konce června.

    • Používejte seed v zadání brm, aby váš kód byl replikovatelný.
    • Váš kód by neměl instalovat žádné balíčky. Pokud budete používat balíčky, u kterých si nebudete jisti, zda jsou běžně nainstalovány, vypište je na začátek reportu.
    • Je v pořádku, pokud bude váš report v .html “neučesaný” (bude vidět pomocný kód, neformátovaný výstup, bez zaokrouhlování apod.). Výpočet (kód brms apod.) by vidět být měl.
    • Pokud budete chtít, pomocné části můžete skrýt pomocí echo=FALSE. Nastavení #| results: hide v .qmd nebo results="hide" v .Rmd skryje dlouhý výstup z brm.

Ať vám to dobře jde!

Footnotes

  1. Například http://www.sthda.com/english/wiki/r-built-in-data-sets nebo https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00Index.html Většina datasetů v R obsahuje jednoduchou dokumentaci (?iris). Nepoužívejte datasety z rethinking nebo brms.↩︎

  2. Můžete používat Quarto (.qmd jako na semináři) nebo RMarkdown (.Rmd)↩︎