Ve své zápočtové úloze jsem se věnoval hmotnosti zrn zelené čočky K-Classic prodávané v Kauflandu, zelené čočky Basic prodávané v Albertu a zelené čočky Lagris. Data jsem získal zvážením náhodného vzorku \(200\) zrn od každého druhu zelené čočky. K vážení jsem použil digitální klenotnickou váhu vážící s přesností na miligramy. Vážil jsem pouze nepoškozená zrna, abych do měření nezanesl hrubé chyby.

Explorační analýza dat

Nejprve jsem se podíval na histogramy všech tří druhů čočky a nechal jsem si vypsat základní statistiky.

hist(cocka_kauf, main="Histogram pro čočku z Kauflandu", xlab ="hmotnost zrn [mg]", ylab ="četnost", col="green2")

hist(cocka_albert, main="Histogram pro čočku z Albertu", xlab ="hmotnost zrn [mg]", ylab ="četnost", col="green3")

hist(cocka_lagris, main="Histogram pro čočku Lagris", xlab ="hmotnost zrn [mg]", ylab ="četnost", col="green4")

summary(cocka)
##    cocka.kauf     cocka.albert    cocka.lagris  
##  Min.   :31.00   Min.   :28.00   Min.   :30.00  
##  1st Qu.:54.00   1st Qu.:53.75   1st Qu.:63.00  
##  Median :63.00   Median :65.00   Median :69.00  
##  Mean   :60.63   Mean   :63.95   Mean   :69.22  
##  3rd Qu.:67.00   3rd Qu.:73.00   3rd Qu.:78.00  
##  Max.   :78.00   Max.   :99.00   Max.   :96.00

Rozhodl jsem se otestovat následující hypotézy:

Rozdělení hmotnosti čočky

Provedl jsem Shapirův-Wilkův test normality pro čočku z Kauflandu. Nulová hypotéza je že data mají normální rozdělení.

shapiro.test(cocka_kauf)
## 
##  Shapiro-Wilk normality test
## 
## data:  cocka_kauf
## W = 0.96784, p-value = 0.000154

p-hodnota mi vyšla jako \(0.0002\), tedy nulovou hypotézu musím zamítnout. To setjné jsem zkusil pro čočku z Albertu.

shapiro.test(cocka_albert)
## 
##  Shapiro-Wilk normality test
## 
## data:  cocka_albert
## W = 0.99113, p-value = 0.2598

Tentokrát mi ale p-hodnota vyšla jako \(0.2598\), a proto nulovou hypotézu zamítnout nemohu.Test jsem provedl i pro čočku Lagris.

shapiro.test(cocka_lagris)
## 
##  Shapiro-Wilk normality test
## 
## data:  cocka_lagris
## W = 0.98822, p-value = 0.09742

Pro čočku lagris mi vyšla p-hodnota jako \(0.0974\), tudíž ani tady nulovou hypotézu nezamítám.

Zdá se, že hmotnost čočky z Albertu a hmotnost čočky Lagris má normální rozdělení, zatímco hmotnost čočky z Kauflandu se tímto rozdělením neřídím. Nabízí se vysvětlení, že zatímco čočka z Albertu a čočka Lagris je jednodruhová, tak čočka z kauflandu je ve skutečnosti směsí několika málo odrůd s různými průměrnými hmotnostmi zrn. Pro potvrzení této hypotézy ale nemám dostatek dat a bylo by potřeba provést další zkoumání s větším počtem zrn čočky.

Rozdělení hmotnosti čočky

Pro otestování nulové hypotézy, že se rozdíl středních hodnot rozdělení je \(0\), jsem se rozhodl použít dvouvýběrový Studentův t-test. Studentův t-test lze ale použít jen když náhodný výběr pochází z normálního rozdělení, což pro čočku z Kauflandu neplatí. Test jsem proto provedl jen pro čočku z Albertu a čočku Lagris, u kterých Shapirův-Wilkův test normality ukázal na normální rozdělení.

t.test(cocka_albert, cocka_lagris, var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  cocka_albert and cocka_lagris
## t = -4.1349, df = 398, p-value = 4.333e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -7.7756 -2.7644
## sample estimates:
## mean of x mean of y 
##    63.955    69.225

p-hodnota mi vyšla jako \(4.333\times 10^{-5}\). Nulovou hypotézu tedy zamítám a můžu tvrdit, že zrna čočky Lagris váží více než zrna čočky z Albertu.