コンテンツ
数学用語では、「平均」は平均です。平均は、データセットを有意義に表すために計算されます。たとえば、気象学者は、シカゴの1月22日の平均気温が過去のデータに基づいて華氏25度であることを伝えることができます。この数値は、来年1月22日のシカゴの正確な気温を予測することはできませんが、その日にシカゴに行く場合はジャケットを梱包する必要があることを十分に伝えています。 2つの一般的に使用される平均は、算術平均と幾何平均です。データに使用するものを知ることは、それらの違いを理解することを意味します。
計算式
データセットの算術平均と幾何平均の最も明らかな違いは、それらの計算方法です。算術平均は、データセット内のすべての数値を合計し、結果をデータポイントの総数で割ることによって計算されます。
例:11、13、17、および1,000の算術平均=(11 + 13 + 17 + 1,000)/ 4 = 260.25
データセットの幾何平均は、データセット内の数値を乗算し、結果のn番目のルートを取得することで計算されます。「n」はセット内のデータポイントの総数です。
例:11、13、17、および1,000の幾何平均=(11 x 13 x 17 x 1,000)の4番目のルート= 39.5
外れ値の影響
算術平均と幾何平均の計算結果を見ると、外れ値の影響が幾何平均で大きく減衰していることがわかります。これは何を意味するのでしょうか? 11、13、17、および1,000のデータセットでは、数値が他のすべてよりもはるかに高いため、数値1,000は「外れ値」と呼ばれます。算術平均を計算すると、結果は260.25です。データセットには260.25に近い数字もないため、この場合、算術平均は代表的ではありません。外れ値効果は誇張されています。 39.5の幾何平均は、データセットのほとんどの数値が0〜50の範囲内にあることを示すのに適しています。
用途
統計学者は算術平均を使用して、有意な外れ値のないデータを表します。このタイプの平均は、平均気温を表すのに適しています。シカゴの1月22日の気温はすべて-50〜50°Fであるためです。10,000°Fの気温は発生しません。バッティング平均や平均レースカーの速度なども、算術平均を使用して適切に表されます。
幾何平均は、データポイント間の差が対数的または10の倍数で変化する場合に使用されます。生物学者は幾何学的平均を使用して、細菌集団のサイズを記述します。エコノミストは、幾何学的手段を使用して所得分布を記述することができます。あなたとあなたの隣人のほとんどは年間約65,000ドルを稼ぐかもしれませんが、丘の上にいる人が年間6500万ドルを稼ぐとしたらどうでしょう?近所の収入の算術平均はここでは誤解を招く可能性があるため、幾何平均がより適しています。