コンテンツ
重回帰は、いくつかの独立変数と従属変数の間の関係を調べるために使用されます。多重回帰モデルを使用すると、これらの独立変数または予測変数、依存変数または基準変数の相対的な影響を分析できますが、これらの頻繁に複雑なデータセットは、適切に分析しないと誤った結論につながる可能性があります。
重回帰の例
不動産業者は、重回帰を使用して住宅の価値を分析できます。たとえば、家の大きさ、年齢、寝室の数、近所の平均住宅価格、学校までの距離を独立変数として使用できます。これらを重回帰モデルにプロットし、これらの要因を使用して、基準変数としての住宅価格との関係を確認できます。
重回帰モデルを使用するもう1つの例は、管理職の給与を決定する人事部門の誰か(基準変数)です。予測変数は、各マネージャーの年功歴、平均労働時間、管理対象の人数、マネージャーの部門予算などです。
重回帰の利点
重回帰モデルを使用してデータを分析することには、主に2つの利点があります。 1つは、1つまたは複数の予測変数の基準値に対する相対的な影響を判断する機能です。不動産業者は、家のサイズと寝室の数が家の価格と強い相関関係を持ち、学校への近さはまったく相関関係がなく、それが主に退職の場合は負の相関関係さえあることを見つけることができますコミュニティ。
2番目の利点は、外れ値または異常を識別する機能です。たとえば、人事管理者は、管理職の給与に関連するデータを確認する際に、勤務時間、部門の規模、予算がすべて給与と強い相関関係にあり、年功序列にはないことがわかりました。あるいは、リストされたすべての予測値が、他の従業員と比較して過給されていた1人のマネージャーを除いて、調査対象の各給与に相関していた可能性があります。
重回帰の欠点
通常、重回帰モデルを使用する場合の欠点は、使用するデータにあります。これの2つの例は、不完全なデータを使用し、相関関係が因果関係であると誤って結論付けることです。
たとえば、家の価格を確認するときに、不動産業者が10の家しか見ていなかったとします。そのうちの7つは若い親によって購入されました。この場合、学校の近さの関係により、彼女は、これがコミュニティで販売されているすべての家の販売価格に影響を与えたと信じる可能性があります。これは、不完全なデータの落とし穴を示しています。彼女がより大きなサンプルを使用していた場合、彼女は、販売された100戸の住宅のうち、住宅価値のわずか10%が学校の近接性に関連していることを発見できました。彼女が買い手の年齢を予測値として使用していた場合、若い買い手はコミュニティの家に古い買い手よりも多く支払うことをいとわないことがわかりました。
管理給与の例では、予算が少なく、年功序列が少なく、管理する人員が少ないが、他の誰よりも多く稼いでいる異常値が1人いたとします。人事部長はデータを見て、この個人が過給されていると結論付けることができます。ただし、このマネージャーが会社のWebサイトを担当しており、ネットワークセキュリティで非常に切望されているスキルセットを持っていることを考慮しないと、この結論は誤りになります。