平均および標準偏差を使用してサンプルサイズを決定する方法

11月 2024

著者: Peter Berry

作成日: 13 Aug. 2021

更新日: 13 11月 2024

ビデオ: 標準偏差のサンプルサイズがいくら必要なのか解説します。N=30揃えておけば良い理由がついに明らかに！

適切なサンプルサイズは、調査を実施する人にとって重要な考慮事項です。サンプルサイズが小さすぎる場合、取得されたサンプルデータは、母集団を表すデータの正確な反映になりません。サンプルサイズが大きすぎる場合、調査は非常に費用がかかり、完了するのに時間がかかります。たとえば、調査の目的が米国の女性の平均年齢を見つけることである場合、すべての女性に彼女の年齢を尋ねることは非現実的です。

サンプルサイズを決定するには、必要な信頼レベルと許容するエラーレベルを定義し、決定しようとしている母集団パラメーターの標準偏差を知っているか、推定値を持っている必要があります。

許容するエラーのレベルを定義します。推定しようとしている母集団パラメーターの5％未満の結果が得られる値を選択してください。許容誤差レベルが高いほど、調査結果の重要性が低くなることを考慮してください。

米国の女性の平均年齢（人口パラメーター）を見つける必要がある状況を考えてみましょう。まず、女性の平均年齢を推定します。その推定のために、以前の研究を使用し、その数に0.05を掛けて誤差を見つけます。

研究が利用できない場合、女性自身の平均年齢を概算してください。その推定のために、それぞれ31人の女性のサンプルサイズを持つあなた自身の10の異なる調査でデータを取得します。各調査で、31人の女性の平均年齢を計算します。次に、すべての調査の平均値を計算します。この数値を女性の平均年齢の推定値として使用します。次に、その数値に0.05を掛けてエラーを取得します。調査で得られた平均値の平均が40の場合、0.05（5％）に40を掛けて2を求めます。したがって、2年以内に許容できるエラーを選択してください。

この番号を書き留めてください。サンプルサイズの計算に使用します。サンプル計算の誤差に2を使用すると、人口の女性の実際の平均年齢から2年以内に正確な結果が得られます。エラーが小さいほど、サンプルサイズが大きくなることに注意してください。

使用する信頼レベルを定義します。 90、95、または99％の信頼レベルを選択します。サンプル調査の結果が前のステップで計算した許容誤差内に収まる確率を高めたい場合は、より高い信頼レベルを使用します。選択した信頼レベルが高いほど、サンプルサイズが大きくなることに注意してください。

指定された信頼区間の臨界値を決定します。信頼レベルを90％にするには、クリティカル値1.645を使用します。 90％の信頼区間には1.960のクリティカル値を使用し、99％の信頼レベルには2.575のクリティカル値を使用します。この番号を書き留めてください。サンプルサイズの計算に使用します。

次に、調査で推定しようとしている母集団パラメータの標準偏差を見つけます。問題で指定された母集団パラメーターの標準偏差を使用するか、標準偏差を推定します。指定されていない場合は、同様の研究からの標準偏差を使用します。どちらも利用できない場合は、母集団の約34％になるように標準偏差を概算します。

手順1に記載されている例では、20年が1つの標準偏差であると想定しています。平均年齢が40歳の場合、これは人口の女性の68％が20歳から60歳の間であると推定されることを意味します。

サンプルサイズを計算します。最初に、臨界値に標準偏差を掛けます。次に、この結果をステップ1のエラーで割ります。次に、この結果を2乗します。この結果がサンプルサイズです。

90パーセントの信頼区間（1.645の臨界値）を使用し、2年以内に誤差を指定し、20年の母標準偏差を与える問題の場合、最初に1.645に20を掛けて32.9を取得します。 32.9を2で割って、16.45を取得します。 270.6を取得するには、16.45を平方します。次に大きい整数に切り上げて、271のサンプルサイズを取得します。

調査結果の条件を述べてください。サンプルサイズが271のステップ1の例では、271人の女性のサンプルの平均が、女性の総人口の実際の平均から2年以内であると確信できます。したがって、調査の結果、平均年齢が43歳である場合、米国の女性人口の平均年齢が90パーセントで42〜44歳になる可能性があることを確認できます。