箱ひげ図は、データの分布を表すために使用されます。通常、ボックスプロットは、未処理のテストスコアやサブテストスコアなどの範囲外のデータを強調するために使用されます。箱ひげ図は1次元であり、垂直または水平に描画できます。箱ひげ図を描くには、データの四分位数、中央値、および外れ値を知る必要があります。
データセットの中央の値を見つけることにより、データセットの中央値を決定します。データポイントの数が偶数の場合、2つの中間値の平均を使用します。たとえば、データセット{8、10、12、14、16、18、24}がある場合、中央値は14になります。
中央値として使用される数値より上のデータポイントの中間の数値を取得して、上位四分位値を決定します。たとえば、データセット{8、10、12、14、16、18、35}がある場合、上位四分位数は18になります。
中央値として使用される数値よりも小さいデータポイントの中央の数値を取得して、低い四分位値を決定します。たとえば、データセット{8、10、12、14、16、18、35}がある場合、下位四分位数は10になります。
四分位数の下限に下端を持ち、四分位数の上限に上端を持つボックスを描画します。ボックスの幅は重要ではありません。たとえば、10で始まり18で終わるボックスを描画します。
中央値でボックス全体に線を引きます。たとえば、14のボックス内に線を引きます。
ステップ2の上位四分位値からステップ3の下位四分位値を減算することにより、内部四分位範囲(IQR)を決定します。たとえば、10から18を減算して、IQRが8に等しいことを確認します。
最大値と上位四分位数の差がIRQの1.5倍より大きいかどうかを判断します。値が小さい限り、ボックスから上に線を引きます。たとえば、18と35(17)の差はIQR(12)の1.5倍よりも大きいため、ボックスから12単位の長さの線を引きます。
最小値と下位四分位数の差がIRQの1.5倍より大きいかどうかを判断します。値が小さい限り、ボックスから下に線を引きます。たとえば、10と8(2)の差はIQR(12)の1.5倍未満であるため、ボックスから下に伸びる2単位の線を引きます。
線の外側にある値がボックスの上下にある場合は、アスタリスクをマークします。たとえば、35は上に伸びる線の外側にあるため、35でアスタリスクをマークします。ただし、線は最小値になるため、ボックスの下にアスタリスクはありません。