Pravděpodobnost a statistika 1 (NMAI059) - LS 2023/24

Vyučující Robert Šámal

Souřadnice
Přednáška se koná ve 14:00 v S3. Protože je místnost trochu "přebookovaná", budu ji též v daném čase nabízet streamem v Zoomu. (Pokud nechcete být nahrávání, pokládejte případné dotazy v chatu.) S jistým zpožděním budou videa vystavena.
Rád uvidím na přednásce co nejvíc z vás. Pokud ale váháte, zda se vejdete, hoďte si korunou, zda přijít. To by mělo zhruba vyjít (a zároveň ilustrovat užitečnost pravděpodobnosti).
Odkaz na online kvízy (funkční během přednášky). (Nebo tento odkaz a zadat jméno roomu PRAVDASTAT.)
Zkoušky
Pro ilustraci, co u zkoušky čekat, se podívejte na web stránku minulého ročníku.
Sylabus přednášky
najdete v SISu.
Loňská verze
Pokud budete chtít získat představu o tom, co budeme probírat, můžete se podívat na a web stránku minulého a nebo předminulého ročníku, případně ještě starší Moodle stránku. (Letos ale asi některé věci budeme probírat v trochu jiném rozsahu a lépe :-).)
Literatura
V knihovně najdete mnoho knih a skript k tématu, v SISu najdete seznam doporučených knih. Nový zdroj, k dispozici i na webu autorky je Introduction to Probability for Computing od Mor Harchol-Balter.
Žádná kniha ale neodpovídá probírané látce přesně. Na tomto webu budu postupně uveřejňovat skripta odpovídající probrané látce. Aktuální verze (update 23.6.2024 -- několik překlepů).
Cvičení
Aktivní účast na cvičení vám umožní si z předmětu odnést užitečné dovednosti a také usnadní skládání zkoušky. Podmínky k získání zápočtu vám sdělí příslušný cvičící. Odkazy na stránky jednotlivých cvičení: Robert Šámal, Petr Chmel a David Mikšaník,

Co se dělo na přednáškách

1. přednáška 22.2.2024
Organizační poznámky, úvod. Definice, motivace, příklady pravděpodobnostních prostorů. Věta o základních vlastnostech. Podmíněná pravděpodobnost.
video
2. přednáška 29.2.2024
Pravidlo pro výpočet pomocí zřetězení podmíněné pravděpodobnosti. Věta o úplné pravděpodobnosti s příklady užití (Gambler's ruin). Bayesova věta.
video
3. přednáška 7.3.2024
Nezávislost jevů. Diskrétní náhodné veličiny: popis pomocí pravděpodobnostni funkce. Příklady diskrétních rozdělení: Bernoulliho, geometrické, binomické, Poissonovo, zmínka o hypergeometrickém.
Hezká vizualizace toho, co jsou to náhodné veličiny
Slajdy s grafem pravděpodobnostní funkce a histogramu i s kódem v R co je generuje
video
4. přednáška 14.3.2024
Střední hodnota: motivace, definice. Střední hodnota: hodnoty pro Bernoulliho, geometrické a binomické rozdělení. Alternativní definice pro diskrétní pravděpodobnostní prostor. Střední hodnota diskrétní náhodné veličiny: vlastnosti (linearita, podmíněná střední hodnota, věta o celkové střední hodnotě), výpočet.
video
5. přednáška 21.3.2024
Alternativní vzorec střední hodnoty pomocí survival funkce, aplikace ne geometrické rozdělení.
Rozptyl a jeho vlastnosti. Výpočty pro Bernoulliho, Binomické a Geometrické rozdělení (různými metodami).
Náhodný vektor: sdružená pravděpodobnostní funkce a její vztah s funkcemi marginálními. Rozdělení libovolné funkce dvou náhodných veličin.
video
6. přednáška 28.3.2024
Nezávislost náhodných veličin. Příklad náhodných vektorů: multinomické rozdělení. PNS pro funkci náhodného vektoru. Střední hodnota součtu n.v., součinu nezávislých n.v. Příklad na použití konvolučního vzorce. Kovariance a její vlastnosti. Korelace vs kauzalita. Rozptyl součtu náhodných veličin.
Obecné náhodné veličiny -- motivace, definice distribuční funkce a hustoty.
korelace vs kauzalita
video
7. přednáška 4.4.2024
Vlastnosti distribuční funkce. Spojité náhodné veličiny a jejich popis pomocí hustoty. Využití hustoty -- výpočet pravděpodobnosti intervalu, každý bod má pravděpodobnost nula. Hustota jako limita histogramů. Definice střední hodnoty. Výpočty se spojitými veličinami (Pravidlo naivního statistika, rozptyl, linearita). Příklady spojitých rozdělení: uniformní a exponenciální. Jejich střední hodnota a rozptyl. Souvislost s geometrickým rozdělením. Normální rozdělení -- jeho parametry a základní vlastnosti.
Slajdy s histogramy, grafy hustoty, atd.

video
8. přednáška 11.4.2024
Střední hodnota $N(0,1)$ a jeho rozptyl. Výpočet pomocí $\Phi$. Odolnost vůči součtu. Cauchyho rozdělení (jako varování). Paretovo rozdělení -- výpočty na tabuli byly špatně! Omlouvám se, správná verze ve skriptech, kapitolka 6.5 Paretova distribuce.
Součet diskrétního a spojitého rozdělení vs. jejich "mix". Kvantilová funkce stručně. (Použití na generování bude později.) Spojité náhodné vektory -- sdružená distribuční funkce Pravděpodobnost obdélníku pomocí sdružené distribuční funkce. Hustota. Nezávislost (pomocí distribuční funkce i pomocí hustoty).

Slajdy s histogramy, grafy hustoty, atd.
Ilustrace spojitého náhodného vektoru -- tipněte, jaké je to rozdělení
Další ilustrace spojitého náhodného vektoru
A ještě jedna

video (loňské)
video (letošní, ze začátku bez kamery) Výpočty Paretova rozdělění na tabuli byly špatně! Omlouvám se, správná verze ve skriptech, kapitolka 6.5 Paretova distribuce.
9. přednáška 18.4.2024
Konvoluce pro spojité náhodné veličiny, příklad (součet normálních rozdělení je normální). Důležitý příklad: vícerozměrné normální rozdělení a jeho vlastnosti (použití pro generování bodu na sféře).
Markovova nerovnost. Čebyševova a (bez důkazu) Chernoffova nerovnost. Zákony velkých čísel, aplikace -- Monte Carlo integrování (kruhu).
Ukázky výpočtů:
video
10. přednáška 25.4.2024
Slabý zákon velkých čísel (zlepšení přesnosti opakovaným měřením). Centrální limitní věta -- znění, vysvětlení. Galtonova deska -- ilustrace centrální limitní věty, detailní vysvětlení na wiki stránce.

Statistika -- základní principy. Explorační vs. konfirmační analýza. Přehled obvyklých úloh: bodové a intervalové odhady, testování hypotéz, regrese. Náhodný výběr s opakováním, bez opakování.
Ilustrace zákona velkých čísel a CLV
Totéž v pdf
Totéž jako R-kový notebook, můžete experimentovat sami

o nutnosti náhodného výběru

promítané obrázky
video
11. přednáška 2.5.2024
Bodové ohady: výběrový průměr a výběrový rozptyl. Odhady konzistentní a (asymptoticky) nevychýlené. Vychýlení (bias) a střední kvadratická chyba (MSE). Konstrukce odhadů pomocí metody momentů i maximální věrohodnosti.

video
12. přednáška 9.5.2024
Dokončení k bodovým odhadům: rozdíl mezi populačním a výběrovým průměrem (rozptylem). Důkaz, že výběrový rozptyl je nestranný odhad rozptylu ("má se dělit $n-1$, ne $n$").
Intervalové odhady. -- obecná metoda založená na normálním rozdělení, příklady použití se známým i neznámým rozptylem
video
13. přednáška 16.5.2024
Testování hypotéz. Ilustrační příklady na úvod.
Co znamená hladina významnosti
Obecné schéma: nulová hypotéza, alternativní hypotéza, hladina významnosti, atd. Příklad: testování mince.
Testování střední hodnoty normálního rozdělení (známý vs. neznámý rozptyl, neboli z-test vs. t-test).
Numerická/ordinální/kategorická data. Multinomické rozdělení. Test dobré shody (G-test, $\chi^2$-test) -- předvedení a částečné zdůvodnění.
video
Jupyter notebook s ukázkou testování hypotéz a síly testu: html ipynb.
14. přednáška 23.5.2024
Jednovýběrový vs. dvouvýběrový test vs. párový test.
Lineární regrese (a možné komplikace).
Neparametrické testy -- vlastnosti empirické distribuční funkce (KS test).
Generování náhodných veličin (inverzní transformace, rejection sampling).
Přehled navazujících přednášek:
video