コンテンツ
統計では、文字「p」は特定のイベントが発生する確率または特定の母集団に対して特定のパラメーターが真である確率を示しますが、母集団が大きい場合、直接測定することは非現実的または不可能です。別の方法として、統計学者は測定可能なサンプルを取得し、結果を「p-hat」として示します。これは、三角形の帽子(^)が付いたpとして記述されます。このサンプリング戦略は、大統領などの政府高官が行っている仕事に特定の政策や承認に同意する国の人数を決定しようとする政治投票では一般的です。
P-hatの計算
p-hatの実際の計算は難しくありません。それを行うには、2つの数字が必要です。 1つはサンプルサイズ(n)で、もう1つは問題のイベントまたはパラメーターの発生数(X)です。 p-hatの方程式は、p-hat = X / nです。つまり、目的のイベントの発生数をサンプルサイズで割ることでp-hatを見つけます。
例はこれを明確にするのに役立ちます:
世論調査では、現在の大統領の政策にアメリカ人がどのように同意するかを決定したいと考えています。世論調査員は1,000人の有権者に連絡し、「大統領の方針を承認しますか?」という質問をします。投票では175の回答が得られ、825の回答が得られないため、投票のp-hatは175 / 1,000 = 0.175です。結果は通常、パーセンテージで報告されます。この場合、0.175 x 100 = 17.5パーセントになります。
世論調査におけるPハットの意義
p-hatを決定することは可能ですが、pの値は不明のままであり、p-hatをpの正確な表現として信頼できる程度は信頼レベルとして知られています。サンプルが十分に大きく、本当にランダムな場合にのみ、P-hatはpの信頼できる表現です。政治家はランダムなサンプルを確保するために努力しますが、実際にはそれが困難な場合が多く、結果はしばしば歪められます。スキューは、より大きなサンプルを採取するか、国内のさまざまな地域でアンケートを繰り返すことで対処できます。
p-hatの信頼レベルに影響するもう1つの要因は、実際に質問に回答するアンケートの回答者の数です。多くは回答を拒否し、未定のままにすることを選択します。そうするほど、投票者はp-hatをpに有意義に関連付けることができなくなります。これに対処する1つの方法は、yesまたはnoの回答が必要な簡単な質問をすることです。