Pravděpodobnost a statistika 1 (NMAI059) - LS 2022/23

Vyučující Robert Šámal

Souřadnice
Přednáška se koná ve 12:20 v S3. Budu ji též v daném čase nabízet streamem v Zoomu. (Pokud nechcete být nahrávání, pokládejte případné dotazy v chatu.) S jistým zpožděním budou videa vystavena.
Odkaz na online kvízy (funkční během přednášky). (Nebo tento odkaz a zadat jméno roomu PRAVDASTAT.)
Zkoušky
Zkouškové termíny jsou vypsané v SISu. (Pozor, jeden je v N1, ostatní v S3.)
Bude ještě (právě) jeden termín v září. Upřesním později.
Písemka začíná v čas uvedený v SISu, trvá 2.5 hodiny. Výsledky písemné části budou tentýž den, případně den následující. Získáte známku v rozmezí 1-5. Tu si můžete o jeden stupeň vylepšit při ústní části. Ta bude obvykle den po písemce.
Pro ilustraci, co u zkoušky čekat, se podívejte na web stránku minulého ročníku.
Sylabus přednášky
najdete v SISu.
Loňská verze
Pokud budete chtít získat představu o tom, co budeme probírat, můžete se podívat na Moodle stránku předminulého ročníku a web stránku minulého ročníku se všemi materiály. (Letos ale asi některé věci budeme probírat v trochu jiném rozsahu a lépe :-).)
Literatura
V knihovně najdete mnoho knih a skript k tématu, v SISu najdete seznam doporučených knih.
Žádná kniha ale neodpovídá probírané látce přesně. Na tomto webu budu postupně uveřejňovat skripta odpovídající probrané látce. Aktuální verze (update 22.6.2023).
Cvičení
Aktivní účast na cvičení vám umožní si z předmětu odnést užitečné dovednosti a také usnadní skládání zkoušky. Podmínky k získání zápočtu vám sdělí příslušný cvičící. Odkazy na stránky jednotlivých cvičení: Robert Šámal, Matej Lieskovský, Petr Chmel.

Co se dělo na přednáškách

1. přednáška 13.2.2023
Organizační poznámky, úvod. Definice, příklady pravděpodobnostních prostorů. Věta o základních vlastnostech. Podmíněná pravděpodobnost.
video
2. přednáška 20.2.2023
Příklady pravd. prostorů (geometrický i vážený geometrický). Pravidlo pro výpočet pomocí zřetězení podmíněné pravděpodobnosti. Věta o úplné pravděpodobnosti (s příklady užití). Bayesova věta. Nezávislost (dvou) jevů.
video
3. přednáška 27.2.2023
Diskrétní náhodné veličiny: popis pomocí pravděpodobnostni funkce. Příklady diskrétních rozdělení: Bernoulliho, geometrické, binomické, Poissonovo, okrajově hypergeometrické. Střední hodnota: motivace, definice.
Hezká vizualizace toho, co jsou to náhodné veličiny
Slajdy s grafem pravděpodobnostní funkce a histogramu (ať je nemusíte hledat na videu)
video
4. přednáška 6.3.2023
Střední hodnota: hodnoty pro Bernoulliho, geometrické a binomické rozdělení. Alternativní definice pro diskrétní pravděpodobnostní prostor. Jiná alternativní definice pro náhodné veličiny s přirozenými hodnotami. Střední hodnota diskrétní náhodné veličiny: vlastnosti (linearita, podmíněná střední hodnota, věta o celkové střední hodnotě), výpočet. Rozptyl. (Jen definice.)
video
5. přednáška 13.3.2023
Rozptyl a jeho vlastnosti. Náhodný vektor: sdružená pravděpodobnostní funkce a její vztah s funkcemi marginálními. Nezávislost. Příklad: multinomické rozdělení. Rozdělení libovolné funkce dvou náhodných veličin. PNS pro funkci náhodného vektoru.
video
Oprava: v konvolučním vzorci jsem napsal $y$ místo $x$. Správně tam mělo být .
Upozornění: minulá přednáška měla několik dní odkaz na loňské video -- tam byla pokryta trochu jiná látka, tak se koukněte, jestli jste něco nevynechali.
6. přednáška 20.3.2023
Střední hodnota součtu n.v., součinu nezávislých n.v. Příklad na použití konvolučního vzorce. Podmíněná pravděpodobnostní funkce. Kovariance a její vlastnosti. Rozptyl součtu náhodných veličin.
Obecné náhodné veličiny -- popis pomocí distribuční funkce, vlastnosti této funkce. Spojité náhodné veličiny a jejich popis pomocí hustoty.
korelace vs kauzalita
video
7. přednáška 27.3.2023
Využití hustoty -- výpočet pravděpodobnosti intervalu, každý bod má pravděpodobnost nula. Generování n.v. s danou hustotou, hustota jako limita histogramů. Definice střední hodnoty. Výpočty se spojitými veličinami (Pravidlo naivního statistika, rozptyl, linearita). Příklady spojitých rozdělení: uniformní a exponenciální. Jejich střední hodnota a rozptyl. Souvislost s geometrickým rozdělením. Normální rozdělení -- jeho parametry a základní vlastnosti.
Slajdy s histogramy, grafy hustoty, atd.

video -- na konci jsem zapomněl posunout kameru, podívejte se případně na video z loňska (konec přeednášky je tam zhruba v polovině).
loňské video
8. přednáška 3.4.2023
Význam normálního rozdělení. Střední hodnota $N(0,1)$. Cauchyho rozdělení (jako varování). Součet diskrétního a spojitého rozdělení vs. jejich "mix". Kvantilová funkce -- dvě věty o univerzalitě; použití pro generování náhodné veličiny. Spojité náhodné vektory -- sdružená distribuční funkce Pravděpodobnost obdélníku pomocí sdružené distribuční funkce.

Ilustrace generování pomocí kvantilové funkce s online gadgetem, kde si můžete hustotu nakreslit a hezkým stručným zdůvodněním.
Slajdy s histogramy, grafy hustoty, atd.
Ilustrace spojitého náhodného vektoru -- tipněte, jaké je to rozdělení
Další ilustrace spojitého náhodného vektoru
A ještě jedna

video
není přednáška 10.4.2023
Užijte si velikonoční prázdniny.
9. přednáška 17.4.2023
Sdružená hustota. Nezávislost náhodných veličin (definice v obecném případě, ekvivalentní podmínka pro spojité veličiny). Konvoluce pro spojité náhodné veličiny, příklad. Důležitý příklad: vícerozměrné normální rozdělení a jeho vlastnosti (použití pro generování bodu na sféře). Trochu o pomíněné hustotě. Markovova nerovnost. Čebyševova a (bez důkazu) Chernoffova nerovnost. Zákony velkých čísel, aplikace -- Monte Carlo integrování.
video
10. přednáška 24.4.2023
Příklad na zákon velkých čísel (zlepšení přesnosti opakovaným měřením). Centrální limitní věta -- znění, vysvětlení. Galtonova deska -- ilustrace centrální limitní věty, detailní vysvětlení na wiki stránce.

Statistika -- základní principy. Explorační vs. konfirmační analýza. Přehled obvyklých úloh: bodové a intervalové odhady, testování hypotéz, regrese. Náhodný výběr s opakováním, bez opakování.
Ilustrace zákona velkých čísel a CLV
Totéž v pdf
Totéž jako R-kový notebook, můžete experimentovat sami

o nutnosti náhodného výběru

promítané obrázky
video
žádná přednáška 1. a 8.5.2023
Kdo máte zájem o lepší pochopení statistické části, doporučuji shlédnout video z loňského roku.
Zejména, na cvičení příští týden přijde čas na zkoušení bodových odhadů. Zejména bude užitečné, pokud budete dopředu tušit, co to ten bodový odhad je, a dvě metody jeho provedení (metoda momentů a metoda maximální věrohodnosti).
11. přednáška 15.5.2023
Stručně bodové odhady. (Podrobnosti video z loňska, viz výše.)
Intervalové odhady (známý i neznámý rozptyl).
Testování hypotéz. Ilustrační příklady na úvod. Obecné schéma: nulová hypotéza, alternativní hypotéza, hladina věrohodnosti, atd. Příklad: testování mince.
co znamená hladina významnosti
video
12. přednáška 22.5.2023
Testování střední hodnoty normálního rozdělení (známý vs. neznámý rozptyl, neboli z-test vs. t-test). Jednovýběrový vs. dvouvýběrový test.
Numerická/kategorická data. Multinomické rozdělení. Test dobré shody (G-test, $\chi^2$-test). Lineární regrese (a možné komplikace). Neparametrické testy -- vlastnosti empirické distribuční funkce (KS test). Generování náhodných veličin (rejection sampling). Přehled navazujících přednášek:

promítané slajdy
video