読者です 読者をやめる 読者になる 読者になる

グラフ警察のおまわりさんこのひとです! Y軸が!!、と通報する前に深呼吸しよう。

統計 visualization

グラフに関して口うるさい人を巷ではグラフ警察とか呼びますが、グラフ警察の人の中には、なんでもかんでも「Y軸がゼロから始まってない!」と言っちゃう人がいます。

それに対してQuartzは「別にええんやで」と諭しています。

これを読んで、なるほどなーと思う一方でなんとなく腑に落ちないところがあったんですが、Voxのすばらしいビデオを見て納得しました。

まあたかだか2分半のビデオなので内容は見てもらうとして、個人的には1:55ごろに出てくるこの言葉が印象的でした。

When people are really lying with charts, the main thing they're normally doing wrong is leaving out the CONTEXT, not leaving out the ZERO.

グラフで嘘をつく人はゼロからの距離をごまかすのではなくて文脈をごまかすのだ、と。

で、これの実例をTLで見かけて、おおっ…てなったので軽く書き残しておきます。

Y軸がゼロから始まっていないグラフ

先日の痛ましい軽井沢のバス事故の報道が続いていますが、その中で、小泉政権時代の規制緩和との関連を指摘する声があります。

そういう意見に添えて、NHKにこんなグラフが出ていたみたいです。

Y軸がゼロから始まっていない棒グラフ。これは今にもグラフ警察が飛んできそうです。ハラハラします。

しかし、注目すべきなのは「グラフがゼロから始まっていない」ことではありません。

もうちょっと期間が長いグラフ

同じデータについて報道ステーションが描いたグラフを見てみましょう。規制緩和より前のデータも入っていて、印象がだいぶ違います。

たしかに規制緩和の年に少しグラフの傾きが大きくなっていますが、その前から増加傾向だったことがわかります。「グラフがゼロから始まっていない」ということに気を取られて増加度がごまかされているのだと思っていましたが、そもそも増加傾向にあったということまでもが隠されていたのです。

これはNHKのグラフを見ただけでは分かりません。ごまかされてしまったY軸は少し注意すれば気づけますが、ごまかされてしまった文脈は元データを知らないと分かりません。まさに「the main thing they're normally doing wrong is leaving out the CONTEXT, not leaving out the ZERO.」という警句が身に染みる事例でした。

感想

たしかに、もろもろの報道とか流れてくるツイートを見ていると規制緩和も要因のひとつであるように思われます。しかし、それを補強したいがために都合のいいデータを切り取ってくるのはやっぱりまずいですよね。

誰もが心の中にグラフ警察の一人や二人は飼っているものですが、「Y軸ガー!」と言う前に少し立ち止まって冷静に元データを見るといいのかもしれません。しかしそれはそう簡単にできるとは限らないので、きっとこの先も文脈を隠されて騙されたりするんだろうな、とちょっと暗い気持ちになりました...。