Pravděpodobnost a statistika 1 (NMAI059)
Vyučující Robert Šámal
- Zkoušky
-
-
Termíny jsou v SISu. Přibude ještě jeden termín v září (upřesním začátkem června).
-
Zkoušky se můžete zúčastnit i před ziskem zápočtu, zejména za účelem poskytnutí více času
pro zpracování statistické úlohy. Nicméně i tak doporučuji neodkládat splnění
podmínek k zápočtu na poslední chvíli -- pokud váš cvičící nebude mít dost času
nebo si třeba zlomí nohu, riskujete komplikace.
-
Podrobnosti o zkoušce:
-
Zkouška je písemná s možností ústního dozkoušení.
-
Termíny písemné části jsou vypsané v SISu, doba trvání 150 minut čistého času.
-
Ke zkoušce můžete mít tahák -- papír formátu A4 oboustranně (vlastnoručně) popsaný libovolnými poznámkami.
-
Bude zkoušena látka v rozsahu, ve kterém byla přednesena.
-
Ke zkoušce si přineste průkaz totožnosti.
-
Po opravení písemky bude všem navržena známka 1-5 (tabulku s výsledky zašlu emailem přes SIS).
-
V tabulce budou uvedeny vaše iniciály. Pokud nechcete, aby ostatní zapsaní na termínu viděli vaše iniciály s vašimi výsledky, napište výrazně na vaši písemku zvolený pseudonym, pod kterým
vás mám v tabulce uvést.
-
Pro studenty píšící písemku prezenčně může tato známka být finální, nebo si ji můžete při ústní části vylepšit
o jeden stupeň -- tj. 4 lze zlepšit na 3, 3 na 2, 2 na 1, ale 5 znamená neúspěch u tohoto termínu zkoušky.
-
Termíny pro ústní část budou vypsány v SISu současně s odesláním výsledků. Budou vypsány typicky na následující den (nebo podle dohody),
kapacita podle počtu studentů účastnících se písemné části.
-
Pro ilustraci zkoušková písemka z minulého roku
a její řešení.
-
1. zkoušková písemka a její řešení.
-
2. zkoušková písemka.
-
3. zkoušková písemka.
-
4. zkoušková písemka.
-
5. zkoušková písemka.
- Souřadnice
-
Přednáška se koná v pátek 10:40-12:10 v S3.
Budu ji též v daném čase nabízet v Zoomu.
(Možná ale nezvládnu reagovat na vaše dotazy.)
S jistým zpožděním budou videa vystavena.
Odkaz na online kvízy (funkční během přednášky).
(Nebo tento odkaz a zadat jméno roomu PRAVDASTAT.)
- Sylabus přednášky
-
najdete v SISu.
- Loňská verze
-
Pokud budete chtít získat představu o tom, co budeme probírat, můžete se podívat na
Moodle stránku minulého ročníku
se všemi materiály. (Letos ale asi některé věci budeme probírat v trochu jiném rozsahu.)
- Literatura
-
V knihovně najdete mnoho knih a skript k tématu,
v SISu najdete seznam doporučených knih.
Žádná kniha ale neodpovídá probírané látce přesně.
Na tomto webu budu postupně uveřejňovat skripta odpovídající probrané látce.
Aktuální verze (21.7.2022, poslední změny: hodně překlepů)
Opravený překlep v slabém zákoně velkých čísel (odhad pomoci $\sigma$ a $\varepsilon$
byl špatně -- mělo tam být $\varepsilon^2$). Na přednášce to bylo dobře :-).
- Cvičení
-
Zisk zápočtu ze cvičení je nutnou podmínkou pro účast na zkoušce.
(Pardon, nějakou dobu zde byly konfliktní informace. Zápočet potřebujete až ke kontrole
splnění studijních povinností.)
Navíc, aktivní účast na cvičení vám umožní si z předmětu odnést užitečné dovednosti a také usnadní skládání zkoušky.
Podmínky k získání zápočtu vám sdělí příslušný cvičící.
Odkazy na stránky jednotlivých cvičení:
Robert Šámal,
Martin Mareš,
Matěj Lieskovský,
...
Co se dělo na přednáškách
- 1. přednáška 18.2.2022
-
Organizační poznámky, úvod. Definice, příklady pravděpodobnostních prostorů. Věta o základních vlastnostech. Podmíněná pravděpodobnost.
o podmíněné pravděpodobnosti
video
- 2. přednáška 25.2.2022
-
Pravidlo pro výpočet pomocí zřetězení podmíněné pravděpodobnosti.
Věta o úplné pravděpodobnosti (s příklady užití).
Bayesova věta.
Nezávislost jevů (pro dva i pro více).
Letmý úvod do náhodné veličiny.
video
- 3. přednáška 4.3.2022
-
Diskrétní náhodné veličiny: popis pomocí pravděpodobnostni funkce.
Příklady diskrétních rozdělení: Bernoulliho, geometrické, binomiální,
Poissonovo, okrajově hypergeometrické. Střední hodnota: motivace, definice.
Alternativní definice pro diskrétní pravděpodobnostní prostor.
Střední hodnota pro Bernoulliho, geometrické a binomiální rozdělení.
Hezká vizualizace toho, co jsou to náhodné veličiny
Slajdy s grafem pravděpodobnostní funkce a histogramu (na videu je vidět jenom kus)
video
- 4. přednáška 11.3.2022
-
Střední hodnota diskrétní náhodné veličiny: vlastnosti (linearita, věta o celkové střední hodnotě), výpočet.
Rozptyl. Výpočty pro běžná rozdělení.
Definice náhodného vektoru.
Omlouvám se za pozdní vystavení videa, zapomněl jsem ho na počítači v S3.
video
- 5. přednáška 18.3.2022
-
Náhodný vektor: sdružená pravděpodobnostní funkce a její vztah s funkcemi marginálními.
Nezávislost.
Příklad: multinomické rozdělení.
Rozdělení libovolné funkce dvou náhodných veličin.
Střední hodnota součtu, součinu nezávislých.
Kovariance a její vlastnosti. Rozptyl součtu náhodných veličin.
korelace vs kauzalita
video
- 6. přednáška 25.3.2022
-
Příklad na použití konvolučního vzorce. Podmíněná pravděpodobnostní funkce.
Obecné náhodné veličiny -- popis pomocí distribuční funkce, vlastnosti této funkce.
Spojité náhodné veličiny a jejich popis pomocí hustoty. Opáčko integrálu. Vlastnosti.
Generování n.v. s danou hustotou, hustota jako limita histogramů.
Příklady spojitých rozdělení: uniformní a exponenciální.
Definice střední hodnoty.
Slajdy s histogramy, grafy hustoty, atd. (na videu je vidět jenom kus)
Ilustrace generování pomocí kvantilové funkce s online gadgetem, kde si můžete hustotu nakreslit a hezkým
stručným zdůvodněním.
video
- 7. přednáška 1.4.2022
-
Výpočty se spojitými veličinami (Pravidlo naivního statistika, rozptyl, linearita).
Střední hodnota a rozptyl exponenciálního rozdělení.
Souvislost s geometrickým rozdělením.
Normální rozdělení -- jeho parametry a základní vlastnosti.
Cauchyho rozdělení (jako varování).
Součet diskrétního a spojitého rozdělení vs. jejich "mix".
Kvantilová funkce.
Slajdy s histogramy, grafy hustoty, atd.
video
- 8. přednáška 8.4.2022
-
Věta o celkové střední hodnotě. Kvantilová funkce -- dvě věty o univerzalitě; použití pro generování náhodné veličiny.
Spojité náhodné vektory -- sdružená distribuční funkce, sdružená hustota.
Pravděpodobnost obdélníku pomocí sdružené distribuční funkce.
Nezávislost náhodných veličin (definice v obecném případě, ekvivalentní podmínka pro spojité veličiny).
Důležitý příklad: vícerozměrné normální rozdělení a jeho vlastnosti (použití pro generování bodu na sféře).
Konvoluce pro spojité náhodné veličiny, příklad.
Slajdy s histogramy, grafy hustoty, atd.
Ilustrace spojitého náhodného vektoru -- tipněte, jaké je to rozdělení
Další ilustrace spojitého náhodného vektoru
A ještě jedna
video (omlouvám se za opožděné posuny kamery)
- není přednáška 15.4.2022
-
Užijte si velikonoční prázdniny.
- 9. přednáška 22.4.2022
-
Trochu o pomíněné hustotě a počítání pomocí ní.
Markovova nerovnost. Čebyševova a (bez důkazu) Chernoffova nerovnost.
Zákony velkých čísel, aplikace -- Monte Carlo integrování.
Centrální limitní věta -- znění, vysvětlení.
Ilustrace zákona velkých čísel a CLV
Totéž v pdf
Totéž jako R-kový notebook, můžete experimentovat sami
video
- 10. přednáška 29.4.2022
-
Galtonova deska -- ilustrace centrální limitní věty,
detailní vysvětlení na wiki stránce.
Statistika -- základní principy. Explorační vs. konfirmační analýza.
Přehled obvyklých úloh: bodové a intervalové odhady, testování hypotéz, regrese.
Náhodný výběr s opakováním, bez opakování.
Podrobněji intervalové odhady: pro normální n.v. i přes CLV.
o nutnosti náhodného výběru
promítané obrázky
video
- 11. přednáška 6.5.2022
-
Bodové ohady: výběrový průměr a výběrový rozptyl.
Odhady konzistentní a (asymptoticky) nevychýlené.
Vychýlení (bias) a střední kvadratická chyba (MSE).
Konstrukce odhadů pomocí metody momentů i maximální věrohodnosti.
Studentův t-test.
promítané obrázky s MSE -- pdf
promítané obrázky s MSE -- R notebook
video
- 12. přednáška 13.5.2022
-
Testování hypotéz.
Ilustrační příklady na úvod.
Obecné schéma: nulová hypotéza, alternativní hypotéza, hladina věrohodnosti, atd.
Příklad: testování střední hodnoty normálního rozdělení (známý vs. neznámý rozptyl, neboli z-test vs. t-test).
Jednovýběrový vs. dvouvýběrový test.
Testování Bernoulliho rozdělení (využitím centrální limitní věty).
Numerická/ordinální/kategorická data.
Připomenutí pro příště: multinomické rozdělení.
co znamená hladina významnosti
video
- 13. přednáška 20.5.2022
-
Test dobré shody (G-test, $\chi^2$-test).
Lineární regrese (a možné komplikace).
Neparametrické testy -- vlastnosti empirické distribuční funkce (KS test), permutační test.
Generování náhodných veličin (rejection sampling).
Přehled navazujících přednášek:
promítané slajdy
video