コンテンツ
グループ化された頻度表は、大きなデータセットを小さな「グループ」に整理して簡素化する統計手法です。データが数百の値で構成されている場合、よりわかりやすくするために、それらを小さなチャンクにグループ化することをお勧めします。グループ化された頻度表を作成すると、科学者と統計学者はデータの興味深い傾向を観察できます。
グループ化された頻度表の主な目的は、データ全体の各グループ内で各値が発生する頻度を調べることです。グループ度数分布は、基本的に2つの列を持つテーブルです。 「グループ」というタイトルの最初の列は、データのすべての可能な「グループ化」を表し、「頻度」というタイトルの2番目の列は、各グループ内で各値が発生する頻度を表します。
データを紙に書いて収集します。たとえば、16、17、18、19、10、11、13、14、17、11、12、15の12個の値で構成されるデータがあるとします。
データを並べ替えて、最小の数字で始まり、最大の数字で終わるようにします。この例では、このデータは次のように再配置されます:10,11,11,12,13,14,15,16,17,17,18および19。
最高値と最低値を見つけ、最高値から最低値を差し引きます。この例では、最高値の「19」から最低値の「10」を差し引きます。結果は19-10 = 9です。
グループの数を決定します。ほとんどのデータには5〜10個のグループがあります。データのグループ数を選択するのはあなたの決定です。この例では、12個の値しかないため、合計5つのグループを選択します。
グループ間隔の幅を決定します。幅は、単にグループごとの値の数を意味します。グループの幅は、ステップ3をステップ4で割ることによって得られます。この例では、「9」を「5」で割っています。結果は1.8または9/5 = 1.8です。 1.8から2に切り上げます。このステップでは、グループごとに2つの値しかないと判断しました。
2つの列を作成します。最初の列に「グループ」というタイトルを付けます。最初の列は、データの5つのグループすべてを表します。 2番目の列に「頻度」というタイトルを付けます。 2番目の列は、各値がグループごとに発生した頻度を表します。
グループの最初の列に5つのグループすべてを作成します。各グループの幅は「2」なので、この例では、最初のグループは10〜11です。この最初のグループには2つの値があります。最初の値は10、2番目の値は11です。5つのグループをすべて作成し続けます。 5つのグループはすべて次のようになります。
10-11 12-13 14-15 16-17 18-19
データを集計して、5つのグループすべての頻度を決定します。この例では、最初のグループは10〜11で、集計され、このグループに属する値の数が表示されます。 10-11の最初のグループの下に、3つの値(10,11,11)が含まれていることがわかります。「周波数列」の下に3つを書き込みます。残りの4つのグループの集計を続けます。 5つのグループすべてを完了し、その頻度を集計すると、頻度表が完成します。
ファイナルテーブルは次のようになります。
グループ頻度10-11 3
12-13 2 14-15 2 16-17 3 18-19 2