Pravděpodobnost a statistika 1 Letní semestr
Osnova sekce
-
-
Jak je uvedeno v poznámkách o zkoušce, je možnost absolvovat ústní část osobně nebo v Zoomu. Také může být stejný den, nebo až další.
Pro hladkou organizaci by mě zajímalo, kolik lidí preferuje kterou možnost. (Odpověď není závazná.)
-
Pokud je vám nejasné něco, co se týká přednášky nebo cvičení, zeptejte se raději tady, než emailem: třeba to bude zajímat i někoho dalšího.
Můžete se ptát na dotazy organizační, problém s technologií, dotazy odborné k probírané látce, nebo navrhovat lepší formát přednášky či cvičení :-).
-
Jednou ze čtyř podmínek pro zisk zápočtu je odevzdání zápočtové úlohy ze statistiky, zpracované na počítači. Její formu jsem vysvětloval na cvičení 11.5. Zde shrnutí
- Úlohu si vymyslíte sami (podobně jako třeba zápočtový program z programování).
- V úloze musíte pracovat se "skutečnými daty":
- která naměříte v reálném životě (počet zaparkovaných aut před supermarketem, zpoždění autobusu, počet lidí ve frontě na lanovku (nebo testování na covid), počet emailů za den, nebo návštěvníků na webu, který spravujete, ...
- která najdete na internetu (kdybyste nechtěli hledat sami, zkuste jeden z následujících)
- která vygenerujete nějakým zajímavým způsobem
- Na data použijete nějaký netriviální statistický test z přednášky, případně několik.
- Ideální forma zpracování: R notebook. Odevzdáte R-kový soubor (s příponou Rmd), pdf/html výstup a případný datový soubor (pokud tomu nebrání tajnost dat, nebo tak něco). V notebooku bude vysvětleno vše -- o jaká data se jedná, odkud jsou, co chceme zjistit, jaké testy/odhady použijeme, ...
- Můžete použít libovolnou R-kovou knihovnu (ale není to určitě potřeba).
- Pokud jste někdo zvyklí dělat statistiku v Pythonu, tak i ten můžete použít.
- Hodnocení bude zahrnovat jak obtížnost úlohy, tak kvalitu zpracování. Pokud se mi bude zdát vybraný problém jako příliš lehký, budete mít možnost doplnit.
- Nejhezčí řešení budou vystavena pro ostatní studenty (i pro další semestry) -- pokud by vám to vadilo, napište a zveřejňovat nebudu.
- Termín pro řešení nestanovuji, ale ke skládání zkoušky budete potřebovat zápočet. (K zápisu termínu ne.)
- Očekávám, že každý bude mít svoje téma, nesdílené s ostatními.
Ukázka prací vašich předchůdců: https://iuuk.mff.cuni.cz/~samal/PSt-Vystavka/
-
-
Organizační poznámky, úvod. Definice, příklady pravděpodobnostních prostorů. Věta o základních vlastnostech. Podmíněná pravděpodobnost.
-
Zoom mi v jednu chvíli přestal nahrávat.
Můžete případně zkusit nahrávku z minulého semestru, příklady by měly být stejné: https://stream.cuni.cz/cs/Detail/8349
-
-
Shrnutí z minula. Zřetězené podmiňování, věta o úplné pravděpodobnosti, Bayesova věta. Příklady.
Nezávislost. Spojitost pravděpodobnosti.
Úvod do náhodných veličin. (Probráno bylo to, co je popsané.)
-
-
Diskrétní náhodné veličiny. Distribuční funkce a její vlastnosti. Přehled pojmenovaných rozdělení.
Střední hodnota -- dvě definice, pravidlo LOTUS, trochu o rozptylu.
-
Ukázka práce s R-kem (a RStudiem): simulace domácího příkladu z prvního cvičení.
-
Vyřešte ze seznamu pro cvičení 16.3. příklad 9 (dvanáctistěnná kostka). O střední hodnotě ani rozptylu nepotřebujete nic víc, než definici z přednášky (případně větu o E(X^2) - E(X)^2 pro snazší počítání). Příklad vyřešte dvěma způsoby
- výpočtem podle definice (na papíře či na počítači -- jde o to, abyste věděli, jak to spočítat, není nutné trénovat numerické výpočty na papíře).
- samplováním: např. v R imitací výpočtu příkladu s kostkami, který jsem předváděl na minulém cvičení. Nápověda: pokud příkazu sample zadáte vektor s opakujícími se složkami, dělá to co byste chtěli, tj. např. sample(c(1,1,2),30,replace=T) nahází zhruba dvakrát víc jedniček než dvojek. Můžete využít příkazy mean(), var(), příp. sd().
Ideálně odevzdejte vše ve formátu pdf, ale programy v R můžete i jako R Notebooky (soubor.Rmd).
Konzultace s jínými studenty jsou dovolené (dokonce i vhodné, pokud vám spolupráce vyhovuje). Neměla by však spočívat pouze v opsání cizího řešení bez pochopení. Po domluvě, jak na to, sepište prosím řešení každý za sebe (ve vlastním zájmu, pomůže vám to látku pochopit).
Řešení odevzdávejte v pdf formátu (např. jako sken vhodnou mobilní aplikací).
Upozorňuji, že zde odevzdávají studenti, kteří se účastní cvičení v úterý 12:20, ostatní odevzdávají jinde.
-
V Pythonu i v Rku.
-
-
-
Vlastnosti střední hodnoty (zejména linearita) a rozptylu.
Parametry některých diskrétních rozdělení.
Náhodné vektory -- úvod (sdružená pravděpodobnostní funkce, nezávislost, střední hodnota součinu nezávislých).
-
Zejména náhodné vektory.
-
Vyřešte ze seznamu pro cvičení 23.3., příklad 7 (tři hody kostkou). Části a, b jsem předváděl na cvičení (záznam bude k dispozici). Tak jako minulý týden postupujte dvěma způsoby:
- výpočtem podle definice -- zde stačí části c, d.
- samplováním: např. v R. Budou se vám hodit příkazy R-ka: pmax, table a mean.
Ideálně odevzdejte vše ve formátu pdf, ale programy v R můžete i jako R Notebooky (soubor.Rmd).
Konzultace s jínými studenty jsou dovolené (dokonce i vhodné, pokud vám spolupráce vyhovuje). Neměla by však spočívat pouze v opsání cizího řešení bez pochopení. Po domluvě, jak na to, sepište prosím řešení každý za sebe (ve vlastním zájmu, pomůže vám to látku pochopit).
Upozorňuji, že zde odevzdávají studenti, kteří se účastní cvičení v úterý 12:20, ostatní odevzdávají jinde.
-
-
-
-
Náhodné vektory: multinomické rozdělení, sdružování (coupling), střední hodnota funkce náhodného vektoru, linearita střední hodnoty.
Konvoluční vzorec a jeho užití. Podmíněná pravděpodobnostní funkce.
Úvod do spojitých náhodných veličin.
-
-
-
-
Popis spojité n.v. pomocí hustoty, její střední hodnota, rozptyl.
Příklady spojitých distribucí: uniformní, exponenciální, normální.
(13.5. EDIT: oprava překlepu, X je přibližně rovno Y Delta, dřív bylo jen X = Y.)
(7.7. EDIT: oprava překlepu, kvantilová funkce je inverzní k distribuční pokud je ta distribuční spojitá a navíc rostoucí)
-
-
Cauchyho a Gamma distribuce.
Náhodné vektory -- sdružená distribuční funkce a hustota, vlastnosti.
Nezávislost.
Vícerozměrné normální rozdělení.
-
-
Spojité vektory: marginální hustota, podmíněná distribuční funkce a hustota, podmíněná střední hodnota.
Kovariance a korelace.
Nerovnosti pro náhodné veličiny: Cauchy, Jensen, Markov, Chebyshev, Chernoff.
Silný zákon velkých čísel (a použití k integrování Monte Carlo).
-
-
-
-
Důkaz slabého zákona velkých čísel.
Centrální limitní věta -- vysvětlení znění, ukázky.
Statistika -- úvod. Dva motivační příklady. Empirická distribuční funkce a její vlastnosti.
-
-
Statistika, vlastnosti bodových odhadů.
Výběrový průměr a výběrový rozptyl.
Metody konstrukce bodových odhadů: momentová metoda a metoda maximální věrohodnosti.
-
Bodové odhady -- vysvětlivky, počítačová simulace, odvození pro uniformní rozdělení U(0,theta).
-
-
Bodové odhady: příklad s obecným normálním rozdělením (metoda momentů i max. věrohodnosti).
Intervalové odhady: pomocí CLV i pomocí Studentova rozdělení.
Testování hypotéz -- úvod.
-
-
Testování hypotéz: obecný postup, příklady.
Test dobré shody pomocí chí-kvadrát rozdělení.
Lineární regrese.
-
-
Simpsonův paradox.
Permutační test.
Bootstrapping.
Bayesovská statistika -- lehký úvod.
Generování náhodných proměnných.
-
Bohužel mi tentokrát selhala technika při nahrávání pondělní přednášky, v odkazu je anglický ekvivalent. Kdyby s tím měl někdo problém, ozvěte se.
(A taky se ozvěte, pokud jste někdo pondělní přednášku nahrával.)
-
Pro zájemce nabízím možnost hromadné konzultace -- v normálním čase přednášky, první pondělí ve zkouškovém období. Trvat bude podle zájmu přítomných (max. do 13:30).
Probíhat bude v Zoomu, stejný odkaz jako přednáška. Pokud nebude mít nikdo námitky, budu nahrávat.
Nebude probírána nová látka, ale budu vyjasňovat, co vám není jasné. Každá otázka je možná, žádná není příliš hloupá ani základní, nebojte se zeptat.
Můžete taky napsat otázku (anonymně) pomocí tlačítka níže, když budu předem vědět, co není jasné, tak se mi to třeba povede lépe vyjasnit.
-
- stejný typ příkladů jako v první písemce -- tj. jen pravděpodobnostní část
- pro studenty/tky ze všech cvičení, kteří nemají dost bodů z první písemky
- probíhá online -- v zoom místnosti https://cesnet.zoom.us/j/94958386613?pwd=NGpCK0FDcGo5aTRCVmkrWTZoaEpMQT09
- řešení píšete na papír, odevzdáváte scan nebo fotku