コンテンツ
統計は、不確実性に直面して結論を出すことに関するものです。サンプルを採取するたびに、サンプルが抽出された母集団を本当に反映していることを完全に確信することはできません。統計学者は、推定に影響を与える可能性のある要因を考慮し、不確実性を定量化し、統計テストを実行してこの不確実なデータから結論を導き出すことにより、この不確実性に対処します。
統計学者は、信頼区間を使用して、サンプルに基づいて「真の」母平均を含む可能性が高い値の範囲を指定し、信頼レベルを介してこれの確実性のレベルを表します。信頼レベルの計算はあまり有用ではありませんが、特定の信頼レベルの信頼区間の計算は非常に有用なスキルです。
TL; DR(長すぎる;読まなかった)
標準誤差に以下を掛けて、所定の信頼レベルの信頼区間を計算します Z 選択した信頼レベルのスコア。サンプル平均からこの結果を減算して下限を取得し、サンプル平均に追加して上限を見つけます。 (参考文献を参照)
同じプロセスを繰り返しますが、 t 代わりのスコア Z 小さいサンプルのスコア(n < 30).
信頼区間のサイズの半分を取得し、サンプルサイズの平方根で乗算し、サンプル標準偏差で除算することにより、データセットの信頼レベルを見つけます。結果を調べます Z または t レベルを見つけるためにテーブルでスコア。
信頼レベルと信頼区間の違い
引用符で囲まれた統計を見ると、「CI」(「信頼区間」)の略語または単にプラスマイナス記号の後に数字が続く範囲が後に続くことがあります。たとえば、「成人男性の平均体重は180ポンド(CI:178.14〜181.86)」または「成人男性の平均体重は180±1.86ポンド」です。これらは両方とも、サンプルに基づいて同じ情報を伝えます。使用すると、男性の平均体重はおそらく特定の範囲内に収まります。範囲自体は信頼区間と呼ばれます。
範囲に真の値が含まれていることをできるだけ確実にしたい場合は、範囲を広げることができます。これにより、推定の「信頼レベル」が上がりますが、範囲はより多くの潜在的な重みをカバーします。ほとんどの統計(上記で引用したものを含む)は95%の信頼区間として与えられます。つまり、真の平均値が範囲内にある可能性は95%です。必要に応じて、99%の信頼レベルまたは90%の信頼レベルを使用することもできます。
大規模サンプルの信頼区間またはレベルの計算
統計で信頼レベルを使用する場合、通常、信頼区間を計算するために必要です。これは、たとえば30人以上の大規模なサンプルがある場合は少し簡単です。なぜなら、 Z より複雑ではなく、見積もりのスコア t スコア。
生データを取得し、サンプル平均を計算します(個々の結果を単純に加算し、結果の数で割ります)。個々の結果から平均値を引いて差を求め、この差を二乗して標準偏差を計算します。これらすべての差を合計し、結果をサンプルサイズ-1で除算します。この結果の平方根を取得して、サンプルの標準偏差を見つけます(「参考文献」を参照)。
最初に標準誤差を見つけることにより、信頼区間を決定します。
SE = s / √n
どこ s サンプルの標準偏差 n サンプルサイズです。たとえば、男性の平均体重を計算するために1,000人の男性のサンプルを取得し、30のサンプル標準偏差を得た場合、次のようになります。
SE = 30 / √1000 = 30 / 31.62 = 0.95
これから信頼区間を見つけるには、区間で計算したい信頼水準を調べます Z-スコア表とこの値を掛ける Z スコア。 95%の信頼レベルの場合、 Z-scoreは1.96です。この例を使用すると、これは次のことを意味します。
平均値± Z × SE= 180ポンド±1.96×0.95 = 180±1.86ポンド
ここで、±1.86ポンドは95パーセントの信頼区間です。
代わりに、このサイズの情報がサンプルサイズと標準偏差と共にある場合、次の式を使用して信頼レベルを計算できます。
Z = 0.5×信頼区間のサイズ×√n / s
信頼区間のサイズは±値の2倍であるため、上記の例では、0.5倍が1.86であることがわかります。これは与える:
Z = 1.86 × √1000 / 30 = 1.96
これにより、 Z、あなたはで調べることができます Z-scoreテーブルを使用して、対応する信頼レベルを見つけます。
少量サンプルの信頼区間の計算
小さいサンプルの場合、信頼区間を計算するための同様のプロセスがあります。まず、サンプルサイズから1を減算して、「自由度」を見つけます。
df = n −1
サンプル用 n = 10、これは与える df = 9.
信頼レベルの10進数バージョン(つまり、100で割った信頼レベル)を1から減算し、結果を2またはシンボルで除算して、アルファ値を見つけます。
α =(1 – 10進数の信頼レベル)/ 2
したがって、95パーセント(0.95)の信頼レベルの場合:
α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025
(片方の尾)でアルファ値と自由度を調べる t 分布表を作成し、結果を書き留めます。または、上記の2による除算を省略し、両側尾を使用します t 値。この例では、結果は2.262です。
前の手順と同様に、この数に標準誤差を掛けて信頼区間を計算します。標準誤差は、サンプルの標準偏差とサンプルサイズを使用して同様に決定されます。唯一の違いは、 Z スコア、あなたが使用します t スコア。