アンケート結果の平均は本当に正しい?系統誤差と標本誤差


SELECT!で作成したアンケートを実施すると、自動的に回答が蓄積・集計されていきます。
あなたは何もしないでもアンケート内容のそれぞれの平均を見ることが出来るのです。

しかしその平均、本当に正しいものでしょうか?

例えば煙草の値上げについてアンケートを取りました。半数以上の人が値上げ賛成で割合で言うと70%以上の人が煙草値上げを肯定的に捉えていました。
ただしこれは完全禁煙のレストランに来店した客から回答を収拾したアンケートでした、、、

これでは本当に日本中の全員の意見が70%以上賛成に近いのか、その傾向があるのかは解りません。完全禁煙のレストランにヘビースモーカーの人はあまり来店しないでしょうから、それらの人々の意見はこのアンケートに反映されていないと思われるからです。
喫煙所でこのアンケートを実施したら全く逆の意見が出るかもしれません。

アンケートで出た平均は、必ずしも日本中の人々の意見の傾向を反映しているというものではない事に注意をする必要があります。
あくまでもアンケートを実施した対象者属性の中での平均なのです。

日本中の人々の意見の傾向に近い結果をアンケートで得たい場合、まさか日本中の人々にアンケートを答えてもらう訳にはいけません。(それが出来れば解決なのですが、現実的ではありません。)
日本中の人々とその属性(性別や年齢、趣味趣向などの個性)の関係を平均化し、アンケート調査対象者をその属性分布の平均を崩さないように実施すれば、誤差が縮まると考えられます。
このようにアンケートを、属性分布の観点から考慮・計画して、選ばれた属性を持つ人々に調査を実施していく方法を標本調査といいます。

あくまでも日本中の人々から回答を回収出来る訳ではありませんから、日本中の人々から回答を集めた結果と標本調査のアンケート結果はどんなに調査対象の選定に注意を払っても多少の誤差が生じます。
この誤差を標本誤差といいます。理論上は調査対象者を正しく選べばこの標本誤差はどの程度生じるのか制御出来ると言われています。

標本誤差に対して、回答者が様々な理由・背景からウソをついたり或いは質問者が誘導尋問をしていたり、そもそも調査対象者の選定が相応しくなかったりして現れたアンケート結果と真実の傾向との間の誤差を系統誤差と言います。系統誤差は意図的な虚偽が原因ですから、根本的にアンケートの作成・実施方法から見直さなければなりません。