味見のスープはよくかき混ぜて 撹拌、撹拌

今年の流行語大賞。

「爆買い」はいいとして、「アベ政治を許さない」とか「SEALDs」とか、やけに政治的な言葉が目につきますね。

選考委員の顔ぶれを見ると、左の方向に傾くのは自然の成り行きでしょうけど。

で、今回はサンプルバイアスについて


世論調査が2,000人のわけ


世論調査の対象はだいたい2,000人です。

2,000人くらいを対象にアンケートを取ると、小さな予測誤差に収まるからです。

統計では、以下の式で必要な調査数(標本数、サンプル数)を計算できます。

小黒とら

n:標本数、λ信頼水準、p回答比率、d標本誤差

λ信頼水準: 95%の確からしさを求めるなら1.96
p回答比率: 分からなければ0.5(50%)で考えれば万全です。
d標本誤差: 誤差を3%に抑えたい場合、0.03です。

それで、この式をd=の式に置き換えて、nを100から3,000まで変化させて計算したのが以下の図です。横軸がサンプル数、縦軸が誤差です。

小黒とら

これを見ると、まあ、だいたい2,000人いればOKだよね、と思えますね。


ところが・・・


ところが、そう簡単な話ではありません。

世論調査やアンケートで大事なのは、何人に聞いたのかというサンプル数

だけではなくて

調査対象に偏りがないか、が大事です。

サンプルがどれだけ「全体」を代表しているか、です。


スープの味見


全体とサンプルの関係は、スープの味見が分かりやすいです。

料理人がスープの味を確かめるのに、大きな鍋の全部を飲み干す必要はありませんよね。

スプーン一杯の量で充分に味見ができます。

大きなスープ鍋の全部が1億3,000万人。スプーン一杯が2,000人です。

で、味見ができるのは、ちゃんと攪拌されて、スプーン一杯のスープと、大きな鍋にあるスープとがほとんど同じだからです。

しばらく置いておいたもので、下が濃厚スープ、上に水っぽいスープとなっていたら・・・

上の部分をたくさん飲んでも、味見にはならないですね。

だから飲む量ではなく、ちゃんとしたサンプルになっているか、が大事なんです。


巣鴨と小学校前


くどいようですがサンプルバイアスについて、もう少し。

たとえば、巣鴨のとげぬき地蔵の周辺で2,000人に年齢のアンケートを取ると、おそらく平均値は70代になるでしょう。

巣鴨のとげぬき地蔵にはお年寄りが集まるので、アンケートのサンプルがお年寄りに偏るからです。こういう偏りを「サンプルバイアス」と言います。

逆に、小学校や中学校の前でアンケートを取ると、平均年齢は非常に若くなります。


ノイジーマイノリティ


ネットやメディアの世論も、サンプルバイアスがあるかもしれませんね。

ノイジーマイノリティと、サイレントマジョリティーのことです。

声の大きい人や活動的な人の意見は伝わりやすいのですが、それは静かな多数の意見とは異なるかもしれません。

だから

不完全かもしれませんが、政治的には選挙の結果、経済的には市場での株価などは、自分の見方とは違っているとしても、それは謙虚に理解しないといけないんだろうなーと思ってます。


まとめ、のようなもの


流行語大賞は、選考委員会が少ないです。

だから国民全体の感覚と合わない言葉が「流行語」に選ばれたのかもしれません。

賞の選考もそうですし、紅白の出演者もそうですし、世論調査やアンケートも、どんな人の意見を反映したものなのかを気にすると面白いですね。

まあ、賞や世論調査などは、結果をそのまま鵜呑みにはできないね。

と思いながらも、

でも、自分の思いが偏っているかもしれないから、賞の選定やアンケートの結果や株式市場の動きは、謙虚に理解しないといけないよね。

という思いもあります。

難しいバランスですね。(^^;

ブログ村:よろしければ一押しをお願いします。
にほんブログ村 株ブログ 投資信託へ にほんブログ村 ライフスタイルブログ セミリタイア生活へ
 

管理者にだけ表示を許可する