散布図は、統計学者の兵器庫における重要な診断ツールであり、2つの変数を相互にグラフ化することで得られます。これにより、統計学者は変数を確認し、それらの関係について作業仮説を立てることができます。このため、通常、回帰分析が実行される前に描画されます。その後、統計学者は回帰分析を使用して仮説をテストし、関係の兆候と正確な大きさを決定します。さらに、散布図は、外れ値(サンプル内のほとんどのデータから異常に離れた値)を識別するのに役立ちます。外れ値を排除すると、回帰モデルの改善に役立ちます。
散布図の2つの変数間の負の関係を確認します。最初の変数の低い値が2番目の変数の高い値に対応する場合、負の相関があります。この場合、データポイントを通る線の傾きは負になります。
変数間の正の関係について散布図を調べます。散布図の最初の変数の低い値が2番目の低い値に対応し、最初の高い値が同様に2番目の高い値に対応する場合、変数は正の相関を持ちます。この場合、データポイントを通る線は正の勾配を持ちます。
変数間の関係がないか散布図を調べます。散布図のデータポイントがランダムに分布し、2つの間に明確な関係がない場合、それらは相関がないか、統計的にわずかな相関しかありません。この場合、データポイントを通る線は水平になり、傾きはゼロになります。
データポイントを通る線を合わせ、その形状を調べて、2つの変数間の関係の性質を評価します。直線は線形関係として解釈され、曲線形状は二次関係を示し、突然上下する前に比較的平らな線は指数関係として解釈されます。
データポイントのクラスターから異常に離れた値である外れ値の散布図を調べます。外れ値は、変数間の関係を歪めます。それらを削除しますが、それらの不在が2つの変数間の関係の分析に影響しない場合のみです。