「村上はん、分かってまっか?」 全国虎党、巨人ファン上回る2053万人
あー,もう,どいつもこいつも適当な調査結果出しやがって!こんなデータ出せば阪神ファンが喜ぶと思ったら大間違いだ!
宮本教授らは「今回の調査は標本(母数)が多いこともあり信頼できる」と判断
ここが一番のツッコミどころ。もちろん標本数が多いにこしたことはないけど,それはあくまで標本抽出のランダム性が確保されている場合の話。今回の調査対象は12万人らしいけど,極端な話,そのうち5万人を阪神戦開始直前の甲子園球場の前で調査した,とかなら,全体のうち阪神ファンがほぼ半数になってしまうという結果が起きてしまう。ここから,必ずしも標本の数の多さが信頼性を高めるとは限らないことが分かる。大事なのはその抽出法。
適切にランダムサンプリングされていれば,最低1000人を調査してれば誤差はかなり少なくなるということは統計学の常識。新聞の世論調査もそれに基づいて,1000人を対象としている。
で,今回のサンプリングの問題点。今回の調査の元データは
これ。調査方法はどうやらメンバーにメールを送り,それへの返信という形らしい。返信するとポイントがもらえるため,ちゃんと返信するようだ。
第1のバイアス(偏り)はここ。「
調査対象者がある特定の集団のメンバーである」。
この集団のメンバーであることでどんな偏りが生まれるか。球団の好き嫌いに直接的には影響しそうにないが,少なくとも「いろんなことに好奇心がある」とか,「情報を積極的に集めている」という意味で,日本国民の平均的な分散を代表する集合とはいえない。
再び調査の内容に目を戻す。ネットでの調査ということで,回答者の年齢構成が若者に偏っていることは一目で分かるだろう。
第2のバイアスはここ。
「調査対象者がネットを使っている」。そしてそれに伴うバイアスは,
「調査対象者の年齢構成が偏っている」ということ。
年配の人と現在の若者とで好きな野球チームに差がある可能性がある。それは,かつて子供の好きなものの代名詞が「巨人・大鵬・卵焼き」と言われたことからも,また,現在は野球情報の入手手段がネット・CS放送と,地域のTV放送事情とあまり関係なくなったことからも推測できる。
このような調査対象の年齢の偏りがあるにもかかわらず,今回の調査はそれを全くコントロールしていない。試しに僕が同じ計算をやろうとしたところ,「10歳以上の総人口数×この調査で阪神が好きと回答した割合」という,誰でもできるような単純な計算式で同じ答えが導き出せた。
ちなみにこの調査の年齢構成にどれほどの問題があるかを示そう。この調査における全回答数のうち,50代と60代以上の回答は全体の10%程度。しかし,日本の人口全体のうち,50代以上の人は40%もいるのだ(高齢化社会フゥー)。60代以上に話を絞ると,人口全体では実に26%もいるのに,この調査では2.6%。
また,統計学使わないで直感的に考えてもおかしいのが,大阪府には422万人の阪神ファンがいるという点。大阪府の人口は880万人。2人に1人が阪神ファン!?大阪に住んでいる人なら分かると思うが,たしかに阪神ファンは多いが,そんなにはいない。
もちろん今回の調査は「どの球団が好きですか」程度の質問なので,一般的に「ファン」といえない人までも数に含まれている可能性もあるが,ネット調査会社が出したデータを,統計的に何のコントロールもせずに,単純な計算で「2千万人が阪神ファンですよ」って,教授の名前で出すその神経疑うわ!
ま,「大学教授」っつってもピンキリなので(こないだ初めて学会に行ってよく分かった),みなさんその肩書きに騙されないようにお気をつけください。