|
区間推定の面白いところは、母集団そのもののサイズ、つまり蛍光灯が全部で何本あるのかは式に出てないという点です。ワインのテイスティングをする時、ボトル1本だろうがボルドー・バレル (225リットルのワイン樽)だろうが、味見は一口で十分です。
そのワインの味を知る上で、全体のサイズは関係ありません。それと似ていて、全体からランダムに抽出して作った標本ならば、全体の状況をよく表していると言えるのです。推定の正確さに母集団のサイズが関係しないという事は、推測統計学の大切なポイントです。
例えば、世論調査の例として内閣支持率がありますが、内閣支持率についても蛍光灯の寿命と同様に区間推定が可能です。その場合、サンプルサイズ=有効回答数となるわけですが、調査の精度は、その国の人口とは無関係に有効回答数だけで決まります。
つまり、中国の方が日本より10倍以上も人口が多いからといって、中国では10倍の人数にアンケートしないと同じ精度を出せないというわけではないのです。1万人へアンケー トを取った場合、人口100万人の国なら総人口の1%を調べたことになりますが、人口1億人の国なら総人口の0.01% しか調べていないことになります。
しかし、総人口の何割を調べたのかということは精度に関係せず、何人を調べたのかということが関係してくるわけです (補足ですが、推測統計学は母集団が調べきれないほど大きい場合を想定しています。したがって、ここでの話は人口数百人の村とかには当てはまりません)。
ただし、アンケートを行う対象には全国民が等しい確率で選ばれるようでなければなりません。特定の性別・年齢・人種などに偏っている標本では、国全体を代表しているとは言えないからです。
調査対象をランダムに選びさえすれば、人口にかかわらず有効回答数で調査の精度が決まるという推測統計学からの帰結は、世論調査を設計する上での重要な前提になっています。だからこそ、世論調査においては無作為性を担保することがとても重要になります。
よく使われるのは、コンピューターで電話番号をランダムに生成し電話をかけてアンケートをお願いするという方法です。それでも、最後の最後でバイアスがかかってしまうこともあります。例えば、ある特定の新聞社が世論調査を行った場合、その新聞社が好きな人は進んでアンケートに答えるでしょうが嫌いな人は無視するか断る確率が高くなります。
結果として、有効回答の中にはその新聞社を支持する人が国全体における比率よりも多めに含まれることになります。地域や電話番号でいくら無作為性を担保しようとしても、こういったバイアスまで避けるのはなかなか難しいところです。新聞社によって内閣支持率の発表値が大きく異なったりするのは、このような理由によると考えられます。
|
|