コンテンツ
直線を一連のデータに当てはめる場合、結果の直線がデータにどの程度適合するかを判断することができます。これを行う1つの方法は、二乗和誤差(SSE)を計算することです。この値は、最適なラインがデータセットをどれだけ近似しているかの尺度を提供します。 SSEは実験データの分析にとって重要であり、わずかな短い手順で決定されます。
回帰を使用してデータをモデル化するのに最適なラインを見つけます。最適な線の形式はy = ax + bです。ここで、aとbは決定する必要があるパラメーターです。これらのパラメーターは、単純な線形回帰分析を使用して見つけることができます。たとえば、最適な線の形式がy = 0.8x + 7であるとします。
方程式を使用して、最適なラインで予測された各y値の値を決定します。これを行うには、各x値を直線の方程式に代入します。たとえば、xが1に等しい場合、それを方程式y = 0.8x + 7に代入すると、y値は7.8になります。
最適線の方程式から予測された値の平均を決定します。これを行うには、方程式から予測されたすべてのy値を合計し、結果の数を値の数で除算します。たとえば、値が7.8、8.6、および9.4の場合、これらの値を合計すると25.8になり、この数を値の数(この場合は3)で割ると8.6になります。
平均から個々の値をそれぞれ減算し、結果の数値を二乗します。この例では、平均8.6から値7.8を引くと、結果の数値は0.8になります。この値を二乗すると0.64になります。
ステップ4のすべての2乗値を合計します。この例の3つの値すべてにステップ4の手順を適用すると、0.64、0、および0.64の値が見つかります。これらの値を合計すると1.28になります。これは二乗和誤差です。