20代による20代でリタイア生活を目指すブログ

不労所得で20万/月を稼ぎ、リタイアを目指すブログです。

【途中式あり! 絶対分かる・解けるt検定】「有意差があるか調べて・検定して」と言われたときやQC検定を受けるときに見る記事

こんにちは。

 

この記事にたどりついたあなたは、先生や上司から

「これって、有意があるの?」

「これって、差があるの?」

「これ、検定してみて。」

「検定の課題をやってこい。」

「QC検定受けろ!」

と言われたことでしょう。

 

でも検定とか有意差とか知らないですよね。(私もそうでした。)

 

そこで、この記事では一つの例を使って実際に検定をしてみたいと思います。

(今回使うt検定で適用できるのは、改善前と改善後の違いなどになります。)

 

さっそく例を挙げてみましょう。

 

部材Aを引っ張ると平均10秒で切れ、部材Bに変えて引っ張ると平均20秒で切れました。さて、部材を変えることによって切れるまでの時間は変わったでしょうか?

部材A:9.5秒、10.2秒、9.7秒、10.5秒、9.3秒、10.8秒、10.0秒

部材B:20.8秒、20.3秒、19.7秒、19.4秒、20.4秒、20.1秒、19.3秒、20.0秒

 

この問題を解いていきましょう。

 

実際はエクセルやRを使って解きますが、先生から「どうやって計算したの?」と聞かれると厄介なので、対策として途中式・計算式を記載したいと思います。

 

 

 

 1.仮説を立てる

まずは2種類の仮説を立てます。

 

H_0:μ_A=μ_B(Aの結果とBの結果は同じ)

H_1:μ_A≠μ_B(Aの結果とBの結果は違う)

 

AとBに違いがあるかどうかを検定したいときは、このように仮説を設定します。

もし、Bのほうがちいさくなったかどうかを検定したいときは、

 

H_0:μ_A=μ_B

H_1:μ_A>μ_B

となります。

 

つまり、H_0:μ_A=μ_Bは固定でH_1のほうを自分が求めている方向に<>を付けます。

 

なのでBのほうが大きくなったかを検定したいときは、H_0は固定で、

H_0:μ_A=μ_B

H_1:μ_A<μ_B

となります。

 

2.有意水準を決める

有意水準[α]は一般的に0.05とされます。

なんで?とは聞かれないと思います。

気にせず行きましょう。

 

α=0.05

 

 

3.棄却域を設定する

棄却域とは、有意か有意でないかの判定値です。

t表というものを使い、表に書いてある値よりも大きい・小さいで判定を行うことができます。

 

まずは棄却域の式からですが、

 

R:|t_0|≧t(φ_A+φ_B),α

φ_A=Aのデータ数-1=7-1=6

φ_B=Bのデータ数-1=8-1=7

となります。

 

(ちなみに、A<Bで検定する場合は、

[tex:R:t_0≧t(φ_A+φ_B),]

A>Bで検定するときは、

[tex:R:t_0≦-t(φ_A+φ_B),]

となります。)

 

すでにα=0.05と決めているので、

R:|t_0|≧t(6+7),0.05

 

ここまでできたらt表を使い、右辺を求めることができます。

(t表はネットで検索してみてください。)

φ(φ_A+φ_B)は13、P(α)は0.05のところを見て、

f:id:hatonorita:20190921185422j:plain


t表より、

 

R:|t_0|≧t(6+7),0.05R:|t_0|≧2.160

 

になります。

t_0がこの2.160よりも大きい値が出たら、有意があることになります。

 

次に、|t_0|(統計量といいます。)を求めます。

|t_0|=\frac{Aの平均-Bの平均}{\sqrt{V(\frac{1}{Aのデータ数   }  +     \frac{1    }{ Bのデータ数}}}

ここで

V=\frac{Aの各データの2乗の和-\frac{Aのデータの合計の2乗}{Aのデータ数}     +Bの各データの2乗の和-\frac{Bのデータの合計の2乗}{Bのデータ数}}{φ_A+φ_B}

 

となります。

何を書いているかわからないと思うので、それぞれ代入してみましょう。

Aの各データの2乗の和=9.5^2+10.2^2+・・・10.0^2=701.76

Aのデータの合計の2乗=(9.5+10.2+・・・10.0)^2=4900

Bの各データの2乗の和=20.8^2+20.3^2+・・・20.0^2=3201.84

Bのデータの合計の2乗=(9.5+10.2+・・・10.0)^2=25600

 

つまり

 

V=\frac{701.76-\frac{4900}{7}+3201.84-\frac{25600}{8}}{6+7}=0.277

 

なので|t_0|=\frac{Aの平均-Bの平均}{\sqrt{V(\frac{1}{Aのデータ数   }  +     \frac{1    }{ Bのデータ数}}}のVに0.277を代入して計算すると、

 

|t_0|=\frac{10-20}{\sqrt{0.277(\frac{1}{7}+\frac{1}{8})}}=36.71

 

4.検定する

棄却域の式に代入します。

R:|t_0|≧t(6+7),0.05

 

R:36.71≧2.160

 

無事に成立しました。

 

よって、

H_0:μ_A=μ_Bを棄却し、

H_1:μ_A≠μ_Bを支持するとなります。

 

つまり、

μ_A(Aの結果)とμ_B(Bの結果)は有意水準5パーセントで違うといえる

となります。