Pravděpodobnost a statistika 1 (NMAI059)

Vyučující Robert Šámal

Zkoušky
Souřadnice
Přednáška se koná v pátek 10:40-12:10 v S3. Budu ji též v daném čase nabízet v Zoomu. (Možná ale nezvládnu reagovat na vaše dotazy.) S jistým zpožděním budou videa vystavena.
Odkaz na online kvízy (funkční během přednášky). (Nebo tento odkaz a zadat jméno roomu PRAVDASTAT.)
Sylabus přednášky
najdete v SISu.
Loňská verze
Pokud budete chtít získat představu o tom, co budeme probírat, můžete se podívat na Moodle stránku minulého ročníku se všemi materiály. (Letos ale asi některé věci budeme probírat v trochu jiném rozsahu.)
Literatura
V knihovně najdete mnoho knih a skript k tématu, v SISu najdete seznam doporučených knih.
Žádná kniha ale neodpovídá probírané látce přesně. Na tomto webu budu postupně uveřejňovat skripta odpovídající probrané látce. Aktuální verze (21.7.2022, poslední změny: hodně překlepů) Opravený překlep v slabém zákoně velkých čísel (odhad pomoci $\sigma$ a $\varepsilon$ byl špatně -- mělo tam být $\varepsilon^2$). Na přednášce to bylo dobře :-).
Cvičení
Zisk zápočtu ze cvičení je nutnou podmínkou pro účast na zkoušce. (Pardon, nějakou dobu zde byly konfliktní informace. Zápočet potřebujete až ke kontrole splnění studijních povinností.) Navíc, aktivní účast na cvičení vám umožní si z předmětu odnést užitečné dovednosti a také usnadní skládání zkoušky. Podmínky k získání zápočtu vám sdělí příslušný cvičící. Odkazy na stránky jednotlivých cvičení: Robert Šámal, Martin Mareš, Matěj Lieskovský, ...

Co se dělo na přednáškách

1. přednáška 18.2.2022
Organizační poznámky, úvod. Definice, příklady pravděpodobnostních prostorů. Věta o základních vlastnostech. Podmíněná pravděpodobnost.

o podmíněné pravděpodobnosti
video
2. přednáška 25.2.2022
Pravidlo pro výpočet pomocí zřetězení podmíněné pravděpodobnosti. Věta o úplné pravděpodobnosti (s příklady užití). Bayesova věta. Nezávislost jevů (pro dva i pro více). Letmý úvod do náhodné veličiny.
video
3. přednáška 4.3.2022
Diskrétní náhodné veličiny: popis pomocí pravděpodobnostni funkce. Příklady diskrétních rozdělení: Bernoulliho, geometrické, binomiální, Poissonovo, okrajově hypergeometrické. Střední hodnota: motivace, definice. Alternativní definice pro diskrétní pravděpodobnostní prostor. Střední hodnota pro Bernoulliho, geometrické a binomiální rozdělení.
Hezká vizualizace toho, co jsou to náhodné veličiny
Slajdy s grafem pravděpodobnostní funkce a histogramu (na videu je vidět jenom kus)
video
4. přednáška 11.3.2022
Střední hodnota diskrétní náhodné veličiny: vlastnosti (linearita, věta o celkové střední hodnotě), výpočet. Rozptyl. Výpočty pro běžná rozdělení. Definice náhodného vektoru.
Omlouvám se za pozdní vystavení videa, zapomněl jsem ho na počítači v S3.
video
5. přednáška 18.3.2022
Náhodný vektor: sdružená pravděpodobnostní funkce a její vztah s funkcemi marginálními. Nezávislost. Příklad: multinomické rozdělení. Rozdělení libovolné funkce dvou náhodných veličin. Střední hodnota součtu, součinu nezávislých. Kovariance a její vlastnosti. Rozptyl součtu náhodných veličin.

korelace vs kauzalita
video
6. přednáška 25.3.2022
Příklad na použití konvolučního vzorce. Podmíněná pravděpodobnostní funkce.
Obecné náhodné veličiny -- popis pomocí distribuční funkce, vlastnosti této funkce. Spojité náhodné veličiny a jejich popis pomocí hustoty. Opáčko integrálu. Vlastnosti. Generování n.v. s danou hustotou, hustota jako limita histogramů. Příklady spojitých rozdělení: uniformní a exponenciální. Definice střední hodnoty.

Slajdy s histogramy, grafy hustoty, atd. (na videu je vidět jenom kus)
Ilustrace generování pomocí kvantilové funkce s online gadgetem, kde si můžete hustotu nakreslit a hezkým stručným zdůvodněním.

video
7. přednáška 1.4.2022
Výpočty se spojitými veličinami (Pravidlo naivního statistika, rozptyl, linearita). Střední hodnota a rozptyl exponenciálního rozdělení. Souvislost s geometrickým rozdělením. Normální rozdělení -- jeho parametry a základní vlastnosti. Cauchyho rozdělení (jako varování). Součet diskrétního a spojitého rozdělení vs. jejich "mix". Kvantilová funkce.
Slajdy s histogramy, grafy hustoty, atd.
video
8. přednáška 8.4.2022
Věta o celkové střední hodnotě. Kvantilová funkce -- dvě věty o univerzalitě; použití pro generování náhodné veličiny. Spojité náhodné vektory -- sdružená distribuční funkce, sdružená hustota. Pravděpodobnost obdélníku pomocí sdružené distribuční funkce. Nezávislost náhodných veličin (definice v obecném případě, ekvivalentní podmínka pro spojité veličiny). Důležitý příklad: vícerozměrné normální rozdělení a jeho vlastnosti (použití pro generování bodu na sféře). Konvoluce pro spojité náhodné veličiny, příklad.

Slajdy s histogramy, grafy hustoty, atd.
Ilustrace spojitého náhodného vektoru -- tipněte, jaké je to rozdělení
Další ilustrace spojitého náhodného vektoru
A ještě jedna

video (omlouvám se za opožděné posuny kamery)
není přednáška 15.4.2022
Užijte si velikonoční prázdniny.
9. přednáška 22.4.2022
Trochu o pomíněné hustotě a počítání pomocí ní. Markovova nerovnost. Čebyševova a (bez důkazu) Chernoffova nerovnost. Zákony velkých čísel, aplikace -- Monte Carlo integrování. Centrální limitní věta -- znění, vysvětlení.

Ilustrace zákona velkých čísel a CLV
Totéž v pdf
Totéž jako R-kový notebook, můžete experimentovat sami

video
10. přednáška 29.4.2022
Galtonova deska -- ilustrace centrální limitní věty, detailní vysvětlení na wiki stránce.

Statistika -- základní principy. Explorační vs. konfirmační analýza. Přehled obvyklých úloh: bodové a intervalové odhady, testování hypotéz, regrese. Náhodný výběr s opakováním, bez opakování. Podrobněji intervalové odhady: pro normální n.v. i přes CLV.

o nutnosti náhodného výběru

promítané obrázky
video
11. přednáška 6.5.2022
Bodové ohady: výběrový průměr a výběrový rozptyl. Odhady konzistentní a (asymptoticky) nevychýlené. Vychýlení (bias) a střední kvadratická chyba (MSE). Konstrukce odhadů pomocí metody momentů i maximální věrohodnosti.
Studentův t-test.

promítané obrázky s MSE -- pdf
promítané obrázky s MSE -- R notebook
video
12. přednáška 13.5.2022
Testování hypotéz. Ilustrační příklady na úvod. Obecné schéma: nulová hypotéza, alternativní hypotéza, hladina věrohodnosti, atd. Příklad: testování střední hodnoty normálního rozdělení (známý vs. neznámý rozptyl, neboli z-test vs. t-test). Jednovýběrový vs. dvouvýběrový test. Testování Bernoulliho rozdělení (využitím centrální limitní věty).
Numerická/ordinální/kategorická data. Připomenutí pro příště: multinomické rozdělení.

co znamená hladina významnosti
video
13. přednáška 20.5.2022
Test dobré shody (G-test, $\chi^2$-test). Lineární regrese (a možné komplikace). Neparametrické testy -- vlastnosti empirické distribuční funkce (KS test), permutační test. Generování náhodných veličin (rejection sampling). Přehled navazujících přednášek:

promítané slajdy
video