コンテンツ
などの統計的検定 t-テストは本質的に標準偏差の概念に依存します。統計学または科学の学生は、標準偏差を定期的に使用し、それが何を意味するのか、そしてデータのセットからそれを見つける方法を理解する必要があります。ありがたいことに、必要なのは元のデータだけです。大量のデータがある場合、計算は面倒ですが、これらの場合は関数またはスプレッドシートデータを使用して自動的に行う必要があります。ただし、重要な概念を理解するために必要なことは、手で簡単に解決できる基本的な例を見ることだけです。基本的に、サンプルの標準偏差は、選択した量がサンプルに基づいて母集団全体でどの程度変化するかを測定します。
TL; DR(長すぎる;読まなかった)
を使用して n サンプルサイズを意味するために、 μ データの平均については、 バツ私 個々のデータポイント(から 私 = 1〜 私 = n)、およびΣを加算記号、サンプル分散(s2)は:
s2 = (Σ バツ私 – μ)2 / (n − 1)
サンプルの標準偏差は次のとおりです。
s = √s2
標準偏差と標準偏差のサンプル
統計は、母集団からのより小さなサンプルに基づいて母集団全体の推定を行い、その過程での推定の不確実性を考慮して行われます。標準偏差は、調査対象の母集団の変動量を定量化します。平均の高さを見つけようとすると、平均(平均)値を中心とした結果のクラスターが得られ、標準偏差はクラスターの幅と母集団全体の高さの分布を表します。
「サンプル」標準偏差は、母集団からの小さな標本に基づいて母集団全体の真の標準偏差を推定します。ほとんどの場合、問題の母集団全体をサンプリングすることはできないため、多くの場合、標準偏差のサンプルが適切なバージョンです。
サンプルの標準偏差を見つける
結果と数字が必要です(n)サンプルに含まれる人々。まず、結果の平均を計算します(μ)個々の結果すべてを合計し、これを測定数で除算します。
例として、5人の男性と5人の女性の心拍数(1分あたりの心拍数)は次のとおりです。
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
これは次のことを意味します:
μ = (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10
= 702 ÷ 10 = 70.2
次の段階では、個々の測定値から平均値を減算し、結果を二乗します。例として、最初のデータポイントの場合:
(71 – 70.2)2 = 0.82 = 0.64
そして2つ目:
(83 – 70.2)2 = 12.82 = 163.84
この方法でデータを続行し、これらの結果を合計します。したがって、サンプルデータの場合、これらの値の合計は次のとおりです。
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
次の段階では、サンプルの標準偏差と母標準偏差を区別します。サンプル偏差については、この結果をサンプルサイズ-1(n −1)。この例では、 n = 10 n – 1 = 9.
この結果は、サンプル分散を与え、 s2、例では:
s2 = 353.6 ÷ 9 = 39.289
サンプルの標準偏差(s)は、この数の正の平方根です。
s = √39.289 = 6.268
母標準偏差を計算していた場合(σ)唯一の違いは、除算することです n のではなく n −1.
サンプル標準偏差の式全体は、合計がサンプル全体にわたる合計記号Σを使用して表現できます。 バツ私 を表す _nのうちi番目の結果。サンプルの分散は次のとおりです。
s2 = (Σ バツ私 – μ)2 / (n − 1)
サンプルの標準偏差は次のとおりです。
s = √s2
平均偏差と標準偏差
平均偏差は標準偏差とわずかに異なります。平均値と各値の差を二乗する代わりに、絶対差を取り(マイナス記号を無視して)、それらの平均を求めます。前のセクションの例では、最初と2番目のデータポイント(71と83)は次のようになります。
バツ1 – μ = 71 – 70.2 = 0.8
バツ2 – μ = 83 – 70.2 = 12.8
3番目のデータポイントは否定的な結果を与えます
バツ3 – μ = 63 – 70.2 = −7.2
ただし、マイナス記号を削除して、7.2と見なします。
これらすべての合計は、 n 平均偏差を与えます。例では:
(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 = 46.4 ÷ 10 = 4.64
これは、平方と根が関係しないため、以前に計算された標準偏差とは大きく異なります。