統計では、母集団からのデータのランダムサンプリングにより、ベルのピークを中心とする平均値を持つベル型の曲線が生成されることがよくあります。これは正規分布として知られています。中心極限定理は、サンプルの数が増えると、測定された平均が母平均の周りに正規分布する傾向があり、標準偏差が狭くなると述べています。中心極限定理を使用して、母集団内の特定の値を見つける確率を推定できます。
サンプルを収集してから、平均を決定します。たとえば、米国の男性のコレステロール値が1デシリットルあたり230ミリグラム以上である確率を計算するとします。 25人の個人からサンプルを収集し、そのコレステロール値を測定することから始めます。データを収集した後、サンプルの平均を計算します。平均値は、各測定値を合計し、サンプルの総数で割ることによって得られます。この例では、平均がデシリットルあたり211ミリグラムであると仮定します。
データの「広がり」の尺度である標準偏差を計算します。これは、いくつかの簡単な手順で実行できます。
この例では、標準偏差が1デシリットルあたり46ミリグラムであると想定しています。
標準偏差を総サンプル数の平方根で割ることにより、標準誤差を計算します。
標準誤差= 46 / sqrt25 = 9.2
適切な確率で正規分布と陰影のスケッチを描きます。例に従って、男性のコレステロール値が1デシリットルあたり230ミリグラム以上である確率を知りたいとします。確率を求めるには、1デシリットルあたりの平均230ミリグラムから離れている標準誤差の数を調べます(Z値)。
Z = 230-211 / 9.2 = 2.07
平均を上回る値2.07の標準誤差を取得する確率を調べます。平均の2.07標準偏差内の値を見つける確率を見つける必要がある場合、zは正です。平均の2.07標準偏差を超える値を見つける確率を見つける必要がある場合、zは負になります。
標準正規確率テーブルでz値を検索します。左側の最初の列は、z値の整数と小数点以下1桁を示しています。上部の行には、z値の小数点以下3桁が表示されます。この例では、z値が-2.07であるため、最初に左側の列で-2.0を見つけ、次に0.07エントリの上の行をスキャンします。これらの列と行が交差する点が確率です。この場合、テーブルから読み取られる値は0.0192であるため、デシリットルあたり230ミリグラム以上のコレステロール値を持つ男性を見つける確率は1.92%です。