一連の数値の「中央値」は、すべてのデータが順番に並べられている場合の中央の数値を指します。中央値計算は、通常の平均計算よりも外れ値による影響が少なくなります。外れ値は他のすべての数値から大きく逸脱した極端な測定値であるため、1つまたは複数の外れ値が標準平均を歪める場合、外れ値のバイアスに抵抗するため、中央値を使用できます。データが追加されると、中央値が変化する可能性がありますが、通常は平均ほど劇的に変化することはありません。
一連の数字を最小から最大の順に並べます。例として、5、8、1、3、155、7、7、6、7、7、8の番号があるとします。1、3、5、6、6、7、7、7、 8、155。
真ん中の数字を探してください。偶数のデータポイントの場合のように、2つの中間の数値がある場合、2つの中間の数値の平均を取得します。この例では、中央の数字は6と7です。2つの数字の平均は合計を2で割ったものなので、中央値6.5になります。
データセット全体の平均は20.5であることに注意してください。そのため、中央値を取ることができる違いを確認できます。 155の数値は外れ値であり、残りの数値とはまったく一致していません。したがって、この場合、中央値は平均よりも優れた尺度を提供します。
番号を取得するたびに、順番に追加してください。例を続けるために、5つの新しいデータポイントを1、8、7、9、205と測定したと仮定します。それらをリストに追加して、1、1、3、5、6、6、7と読み取ります。 7、7、7、8、8、9、155、205
前と同じように、新しい中央値を見つけます。この例では、15個のデータポイントがあるため、真ん中の「7」を見つけるだけです。
平均を使用している場合、29を計算します。これは、どのデータポイントからもかなりのマージンです。
古い中央値から新しい中央値計算を減算して、中央値の変化を計算します。この例では、7.0から6.5を引いた計算になり、中央値が0.5変化したことがわかります。
平均を計算している場合、変更は8.5になります。これはかなり大きなジャンプであり、おそらく不当です。