Zápočtový úkol 1

Motivace

Cílem úkolu je vyzkoušet si analyzovat jednoduchý statistický problém pomocí obvyklé frekventistické analýzy a pro srovnání současně pomocí bayesovských metod.

Úkol nemá být složitý, cílem je zopakovat si kroky, které jsme se učili v rámci seminářů. Obtížnost si můžete sami přizpůsobit volbou problému a detailností analýzy.

Zadání

  1. Najděte si volně dostupný dataset1. Ideálně některý z dostupných datasetů v R, ale můžete hledat i na OSF. Pokud budete používat data z internetu, váš program by si je měl sám stáhnout.

  2. Vyberte si jednoduchý problém nad zvoleným datasetem. Problém by měl být testovatelný pomocí t-testu, ANOVA nebo regrese.

  3. Problém otestujte pomocí frekventistické analýzy (t-test, …). Analýza bude patrně velmi jednoduchá. Nezapomeňte na správnou interpretaci konfidenčního intervalu.

  4. Problém analyzujte pomocí bayesovské analýzy. Postupujte pomaleji a jednotlivé kroky komentujte. Zamyslete se nad volbou priors, zkuste si prior predictive check. Interpretujte odhad parametru (HPDI, credible interval). Pokuste se vizualizovat výsledek modelu (posterior distribution a/nebo posterior predictive distribution).

  5. Výsledek ve formě .qmd (zdrojový kód2) i .html (výsledná podoba) nahrajte do Moodlu do konce ledna.

    • Používejte seed v zadání brm, aby váš kód byl replikovatelný.
    • Váš kód by neměl instalovat žádné balíčky. Pokud budete používat balíčky, u kterých si nebudete jisti, zda jsou běžně nainstalovány, vypište je na začátek reportu.
    • Je v pořádku, pokud bude váš report v .html “neučesaný” (bude vidět pomocný kód, neformátovaný výstup, bez zaokrouhlování apod.). Výpočet (kód brms apod.) by vidět být měl.
    • Pokud budete chtít, pomocné části můžete skrýt pomocí echo=FALSE. Nastavení #| results: hide v .qmd nebo results="hide" v .Rmd skryje dlouhý výstup z brm.

Ať vám to dobře jde!

Footnotes

  1. Například http://www.sthda.com/english/wiki/r-built-in-data-sets nebo https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00Index.html Většina datasetů v R obsahuje jednoduchou dokumentaci (?iris). Nepoužívejte datasety z rethinking nebo brms.↩︎

  2. Můžete používat Quarto (.qmd jako na semináři) nebo RMarkdown (.Rmd)↩︎