Ve své zápočtové úloze jsem se věnoval hmotnosti zrn zelené čočky K-Classic prodávané v Kauflandu, zelené čočky Basic prodávané v Albertu a zelené čočky Lagris. Data jsem získal zvážením náhodného vzorku \(200\) zrn od každého druhu zelené čočky. K vážení jsem použil digitální klenotnickou váhu vážící s přesností na miligramy. Vážil jsem pouze nepoškozená zrna, abych do měření nezanesl hrubé chyby.
Nejprve jsem se podíval na histogramy všech tří druhů čočky a nechal jsem si vypsat základní statistiky.
hist(cocka_kauf, main="Histogram pro čočku z Kauflandu", xlab ="hmotnost zrn [mg]", ylab ="četnost", col="green2")
hist(cocka_albert, main="Histogram pro čočku z Albertu", xlab ="hmotnost zrn [mg]", ylab ="četnost", col="green3")
hist(cocka_lagris, main="Histogram pro čočku Lagris", xlab ="hmotnost zrn [mg]", ylab ="četnost", col="green4")
summary(cocka)
## cocka.kauf cocka.albert cocka.lagris
## Min. :31.00 Min. :28.00 Min. :30.00
## 1st Qu.:54.00 1st Qu.:53.75 1st Qu.:63.00
## Median :63.00 Median :65.00 Median :69.00
## Mean :60.63 Mean :63.95 Mean :69.22
## 3rd Qu.:67.00 3rd Qu.:73.00 3rd Qu.:78.00
## Max. :78.00 Max. :99.00 Max. :96.00
Rozhodl jsem se otestovat následující hypotézy:
Provedl jsem Shapirův-Wilkův test normality pro čočku z Kauflandu. Nulová hypotéza je že data mají normální rozdělení.
shapiro.test(cocka_kauf)
##
## Shapiro-Wilk normality test
##
## data: cocka_kauf
## W = 0.96784, p-value = 0.000154
p-hodnota mi vyšla jako \(0.0002\), tedy nulovou hypotézu musím zamítnout. To setjné jsem zkusil pro čočku z Albertu.
shapiro.test(cocka_albert)
##
## Shapiro-Wilk normality test
##
## data: cocka_albert
## W = 0.99113, p-value = 0.2598
Tentokrát mi ale p-hodnota vyšla jako \(0.2598\), a proto nulovou hypotézu zamítnout nemohu.Test jsem provedl i pro čočku Lagris.
shapiro.test(cocka_lagris)
##
## Shapiro-Wilk normality test
##
## data: cocka_lagris
## W = 0.98822, p-value = 0.09742
Pro čočku lagris mi vyšla p-hodnota jako \(0.0974\), tudíž ani tady nulovou hypotézu nezamítám.
Zdá se, že hmotnost čočky z Albertu a hmotnost čočky Lagris má normální rozdělení, zatímco hmotnost čočky z Kauflandu se tímto rozdělením neřídím. Nabízí se vysvětlení, že zatímco čočka z Albertu a čočka Lagris je jednodruhová, tak čočka z kauflandu je ve skutečnosti směsí několika málo odrůd s různými průměrnými hmotnostmi zrn. Pro potvrzení této hypotézy ale nemám dostatek dat a bylo by potřeba provést další zkoumání s větším počtem zrn čočky.
Pro otestování nulové hypotézy, že se rozdíl středních hodnot rozdělení je \(0\), jsem se rozhodl použít dvouvýběrový Studentův t-test. Studentův t-test lze ale použít jen když náhodný výběr pochází z normálního rozdělení, což pro čočku z Kauflandu neplatí. Test jsem proto provedl jen pro čočku z Albertu a čočku Lagris, u kterých Shapirův-Wilkův test normality ukázal na normální rozdělení.
t.test(cocka_albert, cocka_lagris, var.equal = TRUE)
##
## Two Sample t-test
##
## data: cocka_albert and cocka_lagris
## t = -4.1349, df = 398, p-value = 4.333e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -7.7756 -2.7644
## sample estimates:
## mean of x mean of y
## 63.955 69.225
p-hodnota mi vyšla jako \(4.333\times 10^{-5}\). Nulovou hypotézu tedy zamítám a můžu tvrdit, že zrna čočky Lagris váží více než zrna čočky z Albertu.