コンテンツ
統計では、利用可能なデータに基づいて予測を行います。残念ながら、予測は常にデータによって生成された実際の値と一致するとは限りません。予測とデータの実際の値との違いを知ることは、将来の予測を改善し、より正確にするために役立ちます。予測と生成された実際の値との差を調べるには、データの平均絶対誤差(MAEとも呼ばれます)を計算する必要があります。
SAEを計算する
データのMAEを計算する前に、まず絶対誤差の合計(SAE)を計算する必要があります。 SAEの式はΣですni = 1| x私 - バツt|これは、シグマ表記法に慣れていなかった場合、最初はわかりにくいかもしれません。ただし、実際の手順はかなり簡単です。
真の値を減算します(xで示されます)t)測定値から(xで示される)私)、データポイントに応じて否定的な結果を生成する可能性があります。結果の絶対値を取得して、正の数を生成します。例として、x私 5およびxt 7、5-7 = -2です。 -2の絶対値(| -2 |で示される)は2です。
データの測定値と予測のセットごとにこのプロセスを繰り返します。セットの数は、式のnで示され、Σn i = 1 プロセスが最初のセット(i = 1)で開始され、合計n回繰り返されることを示します。前の例では、使用された前のポイントが10ペアのデータポイントのうちの1つであると想定しています。前に生成された2に加えて、残りのポイントセットは、1、4、3、4、2、6、3、2、および9の絶対値を生成します。
絶対値を合計して、SAEを生成します。この例では、SAE = 2 + 1 + 4 + 3 + 4 + 2 + 6 + 3 + 2 + 9が得られます。これを合計すると、SAEは36になります。
MAEを計算する
SAEを計算したら、絶対誤差の平均値または平均値を見つける必要があります。この結果を得るには、式MAE = SAE÷nを使用します。 MAE =(Σのように見える2つの式が1つに結合されていることもあります。ni = 1| x私 - バツt|)÷n、ただし2つの間に機能的な違いはありません。
SAEをnで除算します。これは、上記のように、データ内のポイントセットの総数です。前の例を続けると、MAE = 36÷10または3.6になります。
必要に応じて、合計を有効桁数に設定します。上記の例ではこの必要はありませんが、MAE = 2.34678361などの数値または繰り返し数値を提供する計算では、MAE = 2.347などのより管理しやすい値に丸める必要がある場合があります。使用される末尾の数字の数は、個人的な好みとあなたが行う仕事の技術仕様によって異なります。