Pravděpodobnost a statistika 1 - cvičení
Tato stránka je věnována cvičením z pravděpodobnosti a statistiky 1 (NMAI059) k přednášce Roberta Šámala.
Cvičení se konají každé pondělí od 14:00 v S10, nebo každou středu od 10:40 v S10, v obou případech na Malé Straně.
Pokud máte nějaký dotaz nebo chcete něco konzultovat, napište mi e-mail na adresu chmel(zavinutá ryba)iuuk.mff.cuni.cz
.
Účast na cvičení je dobrovolná, ale doporučená. Budeme rozebírat řešení domácích úkolů z předchozího týdne, otázky k tématům z přednášky a budeme řešit úlohy pro lepší porozumění.
Podmínky získání zápočtu
Pro zápočet je potřeba získat alespoň polovinu bodů z domácích úkolů a odevzdat statistickou práci.
Domácí úkoly
Bude zadáno 12 domácích úloh, 6 za jeden bod a 6 za dva body, celkem tedy za 18 bodů. Pro zápočet je tedy potřeba z úkolů získat aspoň 9 bodů. Na řešení každého úkolu bude přibližně týden, všechny úkoly se odevzdávají výhradně přes poštovní sovu Martina Mareše. Přihlásíte se stejně jako do SISu přes CAS, pro přihlášení do předmětu potřebujete "Enrollment token", který dostanete mailem.
Úkoly můžete řešit společně s ostatními účastníky cvičení (dokonce si myslím, že to je prospěšné), ale řešení poté formulujte a sepište každý samostatně. Nezapomeňte pečlivě zdůvodnit všechny své kroky, je to důležitější než správný výsledek. Úkoly se budu snažit opravovat průběžně: chybná řešení je možné do termínu odevzdání opravit.
Statistická práce
Ke konci semestru vás ještě bude čekat zápočtová statistická práce s následujícími pravidly.
- Téma si vymyslíte sami (podobně jako třeba u zápočťáku z programování), každý student bude mít jiné téma.
- V úloze budete pracovat se "skutečnými" daty. (Tedy data jste třeba někde naměřili, zajímavým způsobem vygenerovali, nebo někde našli na internetu -- možné zdroje vizte níže.)
- Na tato data použijete nějakou netriviální statistickou metodu.
- Práci odevzdáte také v Sově, obsahovat by měla následující:
- PDF, kde vysvětlíte vše, co děláte
- zdrojová data nebo odkaz na ně (pokud máte citlivá data, buď je zkuste anonymizovat, nebo se nějak domluvíme)
- program, kterým jste data zpracovali (výsledky by měly jít snadno reprodukovat)
- samozřejmě můžete tyto věci zkombinovat například Jupyterovým notebookem nebo R-kovým notebookem.
- R a Python (s libovolnými knihovnami) jsou jako jazyky povoleny automaticky, u jiných jazyků se se mnou radši domluvte.
Co se týče nějakých detailů:
- Předtím, než začnete na práci pracovat, nechte si ode mě potvrdit téma (také v Sově).
- Klidně můžete psát i v angličtině.
- Práci prosím pište srozumitelně (tohle platí pro všechny jazyky).
- Počítejte s tím, že mi oprava může nějakou dobu trvat, do týdne bych to ale měl stíhat. (Tohle je důležité, pokud někdo potřebujete zápočet do nějakého data.)
- Oficiální deadline statistické práce je 15. září.
- Hodnocení je čistě binární: uznáno/neuznáno.
Co jsme dělali
Datum | Obsah |
---|---|
13. 2. 2023 | Úvod, opakování - diskrétní pravděpodobnostní prostory a podmíněná pravděpodobnost. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Začali jsme s opakováním základů diskrétní pravděpodobnosti, na tabuli jsem ukázal úlohy 1-3. |
20. 2. 2023 | Podmíněná pravděpodobnost, zmínka o simulaci v Pythonu a R. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Simulace baterek v Pythonu, bruteforce baterek v Pythonu a simulace baterek v R, řešení (některých) úloh ze cvik. Podívali jsme se na podmíněnou pravděpodobnost, doukázal jsem úlohy 4 a 5 z minule, z tohohle cvičení jsme zvládli úlohy 1-4 a zmínku o Bertrandově paradoxu. |
27. 2. 2023 | Podmíněná pravděpodobnost se zaměřením na Bayesovu větu, rychlý úvod do náhodných veličin. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Kouknuli jsme se na Bayesovu větu, nezávislost a lehce jsme zmínili náhodné veličiny. Celkově jsme se podívali na úlohy 1-6. |
6. 3. 2023 | Náhodné veličiny, distribuce a střední hodnota. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Kouknuli jsme se na diskrétní náhodné veličiny, řekli jsme si pár častých distribucí, podívali jsme se na střední hodnotu, a lehce jsem zmínil rozptyl. Celkově jsme se podívali na úlohy 1-3, 5 a 6. |
13. 3. 2023 | Střední hodnota a rozptyl. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Podívali jsme se na střední hodnotu, rozptyl, a podmíněnou střední hodnotu. Celkově jsme stihli úlohy 1-3, 4 (na tabuli jsem ukazoval jenom 4a) a 5. |
20. 3. 2023 | Ještě trocha distribucí, náhodné vektory a jejich marginální a sdružené rozdělení. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Ilustrace aproximace binomiálního rozdělení pomocí Poissonovského, ukázka binomiálního rozdělení a ukázka Poissonova rozdělení. Řešení (některých) úloh ze cvik. Podívali jsme se na aproximaci binomické distribuce Poissonovou, řekli jsme si oč běží u náhodných vektorů (s důrazem na rozdíl mezi marginálním a sdruženým rozdělením). Celkově jsme stihli říct úlohy 1-2, 4-5. |
27. 3. 2023 | Spojité náhodné veličiny, distribuční funkce a hustota. Úlohy na cvičení, sedmý domácí úkol (protentokrát na zvláštním papíře). Řešení (některých) úloh ze cvik. Zopakovali jsme si spojité náhodné veličiny. Řekli jsme si, co je distribuční funkce, co hustota a jak spolu souvisí. Celkově jsme stihli (přibližně) úlohy 1-3, 5-6. |
3. 4. 2023 | Exponenciální a normální rozdělení. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Podívali jsme se na normální rozdělení, proč nám stačí jenom jedna tabulka distribuční funkce. Taky jsme si řekli, co to je kvantilová funkce a jak souvisí s distribuční funkcí. Celkově jsme stihli úlohy 1-5. |
10. 4. 2023 | Cvičení se nekoná, jsou Velikonoce. |
17. 4. 2023 | Náhodné vektory pro spojité náhodné veličiny. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Řekli jsme si, jak fungují spojité náhodné vektory, a potom jsme si po zbytek hodiny užívali radosti integrování. |
24. 4. 2023 | Konvoluce a podmíněná hustota (s Robertem Šámalem). Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Podívali jste se na ukázku konvoluce (úloha 2) a podmíněnou hustotu (úloha 3). |
1. 5. 2023 | Cvičení se nekoná: Svátek práce. |
8. 5. 2023 | Cvičení se nekoná: Den vítězství. |
15. 5. 2023 | Chvostové nerovnosti a centrální limitní věta. Úlohy na cvičení. Prozkoumali jsme různé chvostové nerovnosti, a stihli jsme první dvě úlohy. |
22. 5. 2023 | Bodové a intervalové odhady, testování hypotéz. Úlohy na cvičení. Jupyter notebook v Google Colab pro bodové odhady, další Jupyter notebooky na stránkách Roberta Šámala. |
Datum | Obsah |
---|---|
15. 2. 2023 | Úvod, opakování - diskrétní pravděpodobnostní prostory a podmíněná pravděpodobnost. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Začali jsme s opakováním základů diskrétní pravděpodobnosti, na tabuli jsem ukázal úlohy 1-4 a řekli jsme si něco o Bertrandově paradoxu. |
22. 2. 2023 | Podmíněná pravděpodobnost, zmínka o simulaci v Pythonu a R. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Simulace baterek v Pythonu, bruteforce baterek v Pythonu a simulace baterek v R, řešení (některých) úloh ze cvik. Podívali jsme se na podmíněnou pravděpodobnost, doukázal jsem úlohu 5 z minule, z tohohle cvičení jsme zvládli úlohy 1-5. |
1. 3. 2023 | Podmíněná pravděpodobnost se zaměřením na Bayesovu větu, rychlý úvod do náhodných veličin. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Kouknuli jsme se na Bayesovu větu, nezávislost a lehce jsme zmínili náhodné veličiny. Celkově jsme se podívali na úlohy 1-6. |
8. 3. 2023 | Náhodné veličiny, distribuce a střední hodnota. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Kouknuli jsme se na diskrétní náhodné veličiny, řekli jsme si pár častých distribucí, podívali jsme se na střední hodnotu, a lehce jsem zmínil rozptyl. Celkově jsme se podívali na úlohy 1-3 a 5. |
15. 3. 2023 | Střední hodnota a rozptyl. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Podívali jsme se na střední hodnotu, rozptyl, a podmíněnou střední hodnotu. Celkově jsme stihli úlohy 1-3, 4 (na tabuli jsem ukazoval jenom 4a) a 5-6. |
22. 3. 2023 | Ještě trocha distribucí, náhodné vektory a jejich marginální a sdružené rozdělení. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Ilustrace aproximace binomiálního rozdělení pomocí Poissonovského, ukázka binomiálního rozdělení a ukázka Poissonova rozdělení. Řešení (některých) úloh ze cvik. Podívali jsme se (z dálky) na aproximaci binomické distribuce Poissonovou, řekli jsme si oč běží u náhodných vektorů (s důrazem na rozdíl mezi marginálním a sdruženým rozdělením). Celkově jsme stihli říct úlohy 1-2, 4-6. |
29. 3. 2023 | Spojité náhodné veličiny, distribuční funkce a hustota. Úlohy na cvičení, sedmý domácí úkol (protentokrát na zvláštním papíře). Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Zopakovali jsme si spojité náhodné veličiny. Řekli jsme si, co je distribuční funkce, co hustota a jak spolu souvisí. Celkově jsme stihli (přibližně) úlohy 1-3, 5-6. |
5. 4. 2023 | Exponenciální a normální rozdělení. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Podívali jsme se na normální rozdělení, proč nám stačí jenom jedna tabulka distribuční funkce. Taky jsme si řekli, co to je kvantilová funkce a jak souvisí s distribuční funkcí. Celkově jsme stihly úlohy 1-5. |
12. 4. 2023 | Náhodné vektory pro spojité náhodné veličiny. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Řekli jsme si, jak fungují spojité náhodné vektory, a potom jsme si po zbytek hodiny užívali radosti integrování. |
19. 4. 2023 | Konvoluce a podmíněná hustota. Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Podívali jsme se na ukázku konvoluce (úlohy 1,2) a podmíněnou hustotu (úloha 3). |
26. 4. 2023 | Chvostové nerovnosti a centrální limitní věta (s Michaelem Skotnicou). Úlohy na cvičení. Zadání úkolu je u úloh ze cvičení. Řešení (některých) úloh ze cvik. Prozkoumali jste různé chvostové nerovnosti, čas potom zbyl jenom na první dvě úlohy. |
3. 5. 2023 | Bonusové cvičení, ukázka využití náhody v teoretické informatice. Fyzická část cvičení tento týden odpadá! Pracovní list. Vše je v Sově; podívali jsme se na pár různých použití pravoděpodobnosti jako třeba náhodné procházky. |
10. 5. 2023 | Cvičení se nekoná: Rektorský sportovní den. |
17. 5. 2023 | Bodové a intervalové odhady, testování hypotéz. Úlohy na cvičení. Jupyter notebook v Google Colab pro bodové odhady, další Jupyter notebooky na stránkách Roberta Šámala. Po dlouhosáhlém úvodu do bodových odhadů včetně řešení první úlohy jsme si řekli, jak správně statisticky testovat hypotézy. Potom jsme už stihli jenom druhou úlohu. |
Zajímavé odkazy
- Bayesova věta pomocí lega
- Zach Star: This is how easy it is to lie with statistics (YouTube, 19 minut) - mimo jiné zmiňuje Prosecutor's fallacy
- 3blue1brown: But what is a convolution? (YouTube, 23 minut)