Statistická úloha (skupina úterý 12:20)
Completion requirements
Jednou ze čtyř podmínek pro zisk zápočtu je odevzdání zápočtové úlohy ze statistiky, zpracované na počítači. Její formu jsem vysvětloval na cvičení 11.5. Zde shrnutí
- Úlohu si vymyslíte sami (podobně jako třeba zápočtový program z programování).
- V úloze musíte pracovat se "skutečnými daty":
- která naměříte v reálném životě (počet zaparkovaných aut před supermarketem, zpoždění autobusu, počet lidí ve frontě na lanovku (nebo testování na covid), počet emailů za den, nebo návštěvníků na webu, který spravujete, ...
- která najdete na internetu (kdybyste nechtěli hledat sami, zkuste jeden z následujících)
- která vygenerujete nějakým zajímavým způsobem
- Na data použijete nějaký netriviální statistický test z přednášky, případně několik.
- Ideální forma zpracování: R notebook. Odevzdáte R-kový soubor (s příponou Rmd), pdf/html výstup a případný datový soubor (pokud tomu nebrání tajnost dat, nebo tak něco). V notebooku bude vysvětleno vše -- o jaká data se jedná, odkud jsou, co chceme zjistit, jaké testy/odhady použijeme, ...
- Můžete použít libovolnou R-kovou knihovnu (ale není to určitě potřeba).
- Pokud jste někdo zvyklí dělat statistiku v Pythonu, tak i ten můžete použít.
- Hodnocení bude zahrnovat jak obtížnost úlohy, tak kvalitu zpracování. Pokud se mi bude zdát vybraný problém jako příliš lehký, budete mít možnost doplnit.
- Nejhezčí řešení budou vystavena pro ostatní studenty (i pro další semestry) -- pokud by vám to vadilo, napište a zveřejňovat nebudu.
- Termín pro řešení nestanovuji, ale ke skládání zkoušky budete potřebovat zápočet. (K zápisu termínu ne.)
- Očekávám, že každý bude mít svoje téma, nesdílené s ostatními.
Ukázka prací vašich předchůdců: https://iuuk.mff.cuni.cz/~samal/PSt-Vystavka/