統計データは、見せ方ひとつで大きく捉え方が変わってきます。
ざっと思いつく嘘のつき方でも、
・10年前から減少していたが、ここ3年で増加してるデータがあったとき、ここ3年だけのデータを見せることで「どんどん増加してます!」と言う事ができる
・グラフの目盛りが10人単位と100人単位で、前者だとかなり変化しているように見えて、後者だとあまり変化してないように見える
・年収が高い人の方が太っている人が多い!と主張することで、太っている人は自分の年収もいずれ高くなると錯覚する(意外とこういう人います)
などなど。
正しい読み取り方をする事で、価値を発揮するのが統計ですので、その分間違った読み方をすることとで大きな損失をつくってしまいます。
そんななか、今回は「シンプソンのパラドクス」というものをご紹介したいと思います。
この例も、見せ方見方によって大きく誤解をしてしまうというものです。
状況としては、2人(今回は太郎くんと花子さん)が、ある試行(今回はバスケのフリースローにします)をそれぞれ計100回、2日にわけて行ったとします。
では、その2日間の様子をダイジェストで書いていきます。
1日目、太郎くんは体調もよく、80本のフリースローを行い、30%の成功率を記録しました。一方花子さんは体調はあまりよくなく、20本のみフリースローを行い、結果もいまいちで25%の成功率でした。
2日目、体調が戻った花子さんは残り80本のフリースローを行い、成功率はなんと50%という好記録をたたき出しました。それに焦った太郎くんは、残り20本のフリースローを丁寧に行い、結果60%の成功率を記録しました。
2日目が終了し、太郎くんは花子さんに一言、
「2日目の成功率、すごかったね。負けるかと思った」
しかしそれを聞いた花子さんは、
「え?私の勝ちよ」
…さて、花子さんはなぜこういった事を言ったのでしょう。
負けず嫌いだから言い放った言葉なのでしょうか。
状況を整理すれば、実は分かります。
2日間の実績を、挑戦数と成功率以外に、成功数も載せた表を作ってみました。
確かにこの表で見ると、太郎君は2日とも花子さんより高い成功率になっています。
しかし、この表に合計の一覧を作ってみると状況は逆転します。
実は、花子さんは45本も成功していました。
それに対して太郎くんは36本のみ。
花子さんはこの事を知っていたので、あのような事を言ったのでしょう。
割合だけで足し算をして考えると、このようにおかしな事が起きてしまいます。
同じく順位だけで考えて合計していくと、おかしな事が起きてしまいます(たとえば営業成績の順位だけで見ていくとおかしなことになります。毎月の売り上げを合計して改めて年間の成績を出さなければいけない、ということですね)
今回ご紹介した例、「うわぁ、複雑だなぁ」ではなく、「不思議ー、おもしろい」と感じてくれていたら幸いです。
書いている人のプロフィール

横山明日希(@asunokibou) 数学のお兄さん。理系、恋愛、WEBの3本柱でイベント開催やコラム執筆など。キーワードは「日常に科学を、人生にワクワクを」「世の中のミスマッチをなくす」「掛け合わせればナンバーワンになる」 詳細プロフィールはこちら