パーセンテージの数字の背景にある事実を読み解こう
大学合格率のパラドックス
あるところに、工学部と情報科学部を持つ大学がありました。それぞれの学部への合格率を、A予備校で勉強した受験生と、B予備校で勉強した受験生とで比較したところ、工学部でも、情報科学部でも、A予備校出身の受験生の方が合格率が高いことがわかりました。ところが、工学部と情報科学部を合わせた大学全体への合格率を比較したところ、B予備校出身の受験生の方が合格率が高くなるという、逆転現象が起きました。データの集計方法は何も間違っていないのに、どうしてこんな現象が起きてしまうのでしょうか。
パーセンテージだけを追うことの危うさ
これは、統計学の世界で「シンプソンのパラドックス」と呼ばれている、有名な現象です。母集団を分割して導き出されたパーセンテージと、母集団全体から得られるパーセンテージが異なってしまう場合があることを示しています。先の例のように、合格率というパーセンテージの数字だけを追ってしまうと、本来把握しておくべき情報が、意外なほど消えてしまう場合があるのです。
別の例を挙げてみましょう。欧州のある大学は、これまで男性のみ入学を許されていましたが、あるときから女性の入学も許可されるようになりました。それから5年の間に、入学した女性の33パーセントがその大学の教員と結婚していることが明らかになりました。割合だけで見ると驚くような数字ですが、実際は、「3名の女性が入学し、うち1名が教員と結婚した」結果の数字でした。このように、分母と分子を確かめずにパーセンテージだけを追うと、その数字が意味するところを見誤ってしまう可能性があるのです。
その数字が意味するものを見極める
統計学の研究において、正確なデータを集めて検討することはもちろん大切ですが、データの背景にある事実関係をしっかりと見定めて、その数字が本当に意味するものは何なのか、慎重に確かめていくこともまた重要です。事実とデータの関係を見極める、冷静な視点が必要なのです。
※夢ナビ講義は各講師の見解にもとづく講義内容としてご理解ください。
※夢ナビ講義の内容に関するお問い合わせには対応しておりません。
先生情報 / 大学情報
大阪工業大学 情報科学部 データサイエンス学科 教授 濵田 悦生 先生
興味が湧いてきたら、この学問がオススメ!
統計学、データサイエンス先生が目指すSDGs
先生への質問
- 先生の学問へのきっかけは?
- 先輩たちはどんな仕事に携わっているの?