シンプソンのパラドックス

統計学は、いろいろな状態や事象を判断する上で、
とても強力なツールとして働くことがあるけど、
統計対象が無作為であるが故にある矛盾を内在することがある。
といって、統計が作為的だったら、
それこそ意味ないってことになるんですがね。
今日、東京で大停電があったとのことで、
それとは全然関係ない話なんだけど、
それでちょっと思い出したことがあるので、
書き記しておこうかと思って。。。
学生時代、私がマジメに電気工学の勉強をしていたとき、
先生の誰かがこんな話をしていました。
(ツッコミたい気持ちはここはオサエテ…)
昔、送電線の近くに住んでいる住人たちによって、
送電による電磁波の影響で住人の健康に害が及んでいる、
として、電力会社を相手取った訴訟があったそうです。
その根拠として、送電線近くに住んでいる住人と、
そうでない住人との2集団にわけて調査してみたとき、
送電線近くの住人の方が若干発病率が高い、
という統計結果になっていると。
これは送電線の電磁波による影響に他ならないっ!
まぁそんな言い分なんですが、
これは半分いいがかりなんだ、と、その先生は力説してたのですな。
マクスウェルの電磁方程式から考えると、
送電による電磁誘導によって発生する電磁場というのは、
距離の2乗に反比例して減衰します。
というか、電磁波が身体に与える影響ははっきりしてないけど、
電磁波なんてのは、送電線でなくとも、
毎日みなさん浴びてるものなんですよと。
こんな話もある。
例えば、毎日コーヒーを1杯以上飲む人が、
飲まない人よりも2倍くらい癌を発症する率が高い、
という統計結果が出ているにもかかわらず、
コーヒーは癌を発症させることを防ぐという可能性について、
学会でその妥当性が認められた、と。
これはどういうことかというと、
コーヒーを飲む、という要因以外の作用が影響して、
その結果、癌発症に至るケースの方が多い、
という可能性の方が高いということだったと。
コーヒーを飲む人は、大抵煙草も吸う、とか。
統計結果にはその要因は含まれていませんからね。
統計結果というのは、
多分、統計学という専門分野ではそういう考慮もちゃんとした上で、
適当なデータとして解析されるものなんです。
でも、素人にしてみれば、
統計というのは単なる多数決だろうという認識しかなく、
多かった結果は正しいと早合点してしまう。
この話って、実は統計だけの話じゃなく、
人の普段の行動とか社会学的な話とかにもいえることで、
結果だけを見て過程が無視されると、
誤った見識しか出てこないのかもしれないなぁ、とかね。

タイトルとURLをコピーしました