Tomáš Jurica: chcel by som sa nieco opytat k ulohe 2. Na cviceniach ste nam viac krat naznacili, ze na porovnanie strednych hodnot los pre HMO a regular poistenia mame pouzit t.test. Mame k dispozicii vela dat, i ked normalita je porusena, mozeme pouzit asymptoticku verziu, avsak ja som stale skepticky voci pouzitiu tohto testu - kedze testova statistika je zalozena na vyberovych priemeroch a v jednej zo skupin je naozaj dost odlahlych pozorovani - dokonca jedna hodnota los je 116, co vzhladom na priemer to moze byt velmi skreslene, a priklonil by som sa pouzit Wilcoxona , avsak vy ste povedali na cviku, ze to nie je dobry napad. Prosim Vas, bol by naozaj taky problem pouzit Wilcoxonov test ? Resp. v pripade odlahlych pozorovani, je interpretacia vysledku t-testu stale rovnaka ? Mozno je odpoved na to velmi trivialna a ja prilis robim z toho vedu.
S tim t-testem bych to videl asi takhle. Pokud si zduvodnim, ze nemam tezke chvosty a "outlieri" v boxplotu jsou spis dusledkem sikmosti rozdeleni (coz podle me je tento pripad), tak bych porad (Welchuv) t-test povazoval za optimalni pro "srovnani dvou skupin" (a je mi jedno, ze to je zalozeno na strednich hodnotach, porad to jsou dobre definovane charakteristiky rozdeleni, na jejichz odlisnost je t-test nejsilnejsi. Kdyz vezmete Wilcoxona, tak ten je optimalni v pripade, ze se ta rozdeleni lisi jenom zmenou polohy (coz zde +-plati, kdyz los zlogaritmujete). Tj. v pripade, ze neplati "jenom zmena polohy" (coz je zde s netransformovanym los), tak Wilcoxon neni spatne (co se hladiny tyka), ale rozhodne bude slabsi nez (Welchuv) t-test. V souhrnu, vase uvahy jsou OK, co se tyka hladiny, ale ne nutne s ohledem na silu.
Pokud budou outlieri skutecne dusledkem tezkych chvostu, tak potom by t-test byl opravdu spatne, nebot pak neplati CLV atd.