2019/01/17
2020/04/14
サンプル数とサンプルサイズの違いをわかりやすく解説
「サンプル数」と「サンプルサイズ」という用語の違いをご存知ですか?統計学を勉強していると,両者を混同・誤用している記事・解説をよく見かけます.本記事では,統計学の基本用語である「サンプル数」,「サンプルサイズ」を正しく使えるようになるために,これらの意味・用法を解説していきます.
サンプル数とサンプルサイズ
簡潔に言うと,
- サンプル数・・・何回標本抽出を行ったか.群数.標本数.
- サンプルサイズ・・・1 回の標本抽出において,何個体を調べたか.各標本,各群の個体数.各群のサイズ.
です.意味としてはシンプルですね.もしかすると,これらの英語での表現を見た方が違いが分かりやすいかもしれません.それぞれ,
- サンプル数: the number of samples
- サンプルサイズ: sample size
と表現されます.これらの言葉の意味を考えるときに注意すべきなのは,「サンプル」という用語の意味です.サンプルとは「標本」,「群」の意味で,ひとまとまりの観測データを表します.そのため,サンプル数(the number of samples)とは「群の数」,サンプルサイズ(sample size)とは「一つの群のサイズ,大きさ」という意味になります.
用語の意味としてはここまで十分です.しかし,用語の意味を覚えただけでは使えるようにはなりません.以下では,具体的に用語の用法を理解するために,実験例を挙げながらサンプル数,サンプルサイズについて考えていきます.
実験例:各都道府県の男子高校生の身長
47 都道府県の男子高校生の身長の平均を比較するという調査を行います.各都道府県から無作為に 1000 人を選んで平均を算出したとき,この調査におけるサンプル数,サンプルサイズはどうなるでしょうか?
正解は,
- サンプル数(群数):47
- サンプルサイズ(各群のサイズ):1000 人 / 群
となります.標本抽出を 47 回行ったためサンプル数は 47,各標本の個体数が 1000 人のためサンプル数は 1000 となります.「サンプル数=群数」,「サンプルサイズ=各群のサイズ」と覚えれば分かりやすいかと思います.
実験例:マウスの投薬実験
続いての例です.癌を発症したマウスに対して.コントロール,薬 A,薬 B(それぞれ,C 群,A 群,B 群とする)を投薬し,一定時間経過後,腫瘍径の母平均の差を比較する実験を行います.実験の予算等の関係で,C 群,A 群,B 群それぞれに対して,5,7,7 個体のデータを取得できたとしたとき,この実験でのサンプル数,サンプルサイズはどうなるでしょうか?
正解は,
- サンプル数(群数):3
- サンプルサイズ(各群のサイズ):(C群,A群,B群) = (5,7,7)
となります.群数はサンプル数.各群の個体数はサンプルサイズに対応しています.実験関係では,しばしば 「n数」 という言葉が使われることがありますが, 「n数=サンプルサイズ」を表していることが多いです.「各群のn数は?」という質問は,「各群のサンプルサイズは?」という質問に置き換えることができます.
まとめ
サンプル数,サンプルサイズの意味,使い方を理解できたでしょうか?単語そのものを覚えるよりも例と絡めて考えた方が格段に分かりやすくなりますね.最後にもう一度,
- サンプル数=群数
- サンプルサイズ=各群の個体数(大きさ)
です.正しく用語を使えるように勉強していきましょう.
用語を覚えたら,仮説検定などの手法を学びながら実際にその使い方を勉強することを強くおすすめします.本記事に関連した話であれば,「この問題のサンプル数,サンプルサイズは何だろうか?」と丁寧に考えてみることで,用語の意味を定着させることができます.検定に関しては,片側検定と両側検定の違いをわかりやすく解説や,仮説検定とは?初心者にもわかりやすく解説!などの記事で丁寧に解説されているため,ぜひお読みください.
Recommended