2017/09/02
2020/04/14
離散型と連続型の違い 例を用いて解説
扱う変数が量的変数の場合、離散型変数(discrete variable)と、連続型変数(continuous variable)に分類することができます(4つの尺度とは別に)。今回は、離散変数と連続変数の違いを解説していきます。
量的変数って何という方はこちら⇨ 質的変数と量的変数の違い
離散型の変数とは?
離散型の変数(discrete variable)とは、取りうる値が飛び飛びになっている変数のことです。例えば、サイコロの出る目、トランプをランダムに一枚引いた時に出る数字の大きさなど、1の次は2、2の次は3というように、1.1や1.5などの値を取ることができません。このような変数を離散型の確率変数と言います。また、このような値を離散量と言います。
連続型の変数とは?
連続型の変数(continuous variable)とは、繋がった値をとる変数です。例えば、身長のように、170cmのこともあれば、170.11cmも取ります。さらに、170.000001cmというのも有り得ます。値と値の間に無限に取りうる値がある、というようなものが連続型の確率変数です。また、このような値を連続量と言います。
数値が飛び飛びでも、取り得る値が多い場合は連続変数として扱うことが有る
離散型と連続型の変数の違いはお分りいただけましたでしょうか。
ここで、前述の説明によると、世の中の全ての観測データは離散型になってしまいそうです。というのも、数値データを実際に観測する場合、必ず有効数値があり、例えば身長を小数点第一位までを観測すると、170.0cm、170.1cm、170.2cmというような感じで、飛び飛びの値を取ることになります。この場合、実際には離散変数ですが、取り得る値が非常に多いので、連続型の変数として扱うことが多いです。
また、例えばテストの点数のように1点から100点まで1点刻みのデータでも、取り得る値が多いので、連続データとして扱うことが多々有ります。
しかし、例えばサイコロの目など6段階のデータの場合、離散型として扱うことが多くなります。しかし、場合によっては連続型として扱うことも有ります。この扱い方の境界に明確な基準は無く、そのときの状況によって臨機応変に対応していく必要が有ります。
Recommended