散布図などの軸だし

本記事はスキルチェックリストの[データサイエンス力 No.105]「散布図などの軸だしにおいて、縦軸・横軸の候補を適切に洗い出せる」に対応しています。

散布図の横軸と縦軸

気温とコーラの売上の散布図を描いてみてください

ロボ千代

アイ

うーん、こんな感じ?

そうですね。
普通は気温を横軸に、コーラの売上を縦軸にしてグラフを描くと思います。

このグラフからは、気温が10℃だとくらいの売上で、
だから20℃だとこれくらいの売上になりそうだな。
と自然に読み取れるのではないでしょうか?

では、今度は縦軸、横軸を逆にしたグラフを見てみます。
横軸と縦軸を逆にした散布図

これって、とても読みにくいグラフに思えませんか?
散布図としては間違っているわけではないのですが、すごく違和感を感じるグラフだと思います。

散布図を描く目的は、何かの予測をしたい場合がほとんどです。
先ほどの気温とコーラの例であれば、気温からコーラの売上の予測をしたいというモチベーションが散布図の裏側にあるはずです。

つまり、「コーラの売上」が目的変数、「気温」がその目的変数の原因となる説明変数です。

人間がグラフを読むときは、縦軸にこの「目的変数」であることを期待しています。
なので、グラフを描くときは、横軸に説明変数、縦軸に目的変数をとるのが自然です。

上のグラフで言えば、「\(x_1\)のときに\(y_1\)の値になるんだな」と普通は読み取ります。
「\(y_1\)のときに\(x_1\)の値になるんだな」という流れにはなりません。

なので、気温とコーラの売上のグラフでいうと、最初のグラフは「気温が30℃のときにはコーラは80個くらい売れるんだな」と自然に読めますが、横軸と縦軸を逆にすると「コーラの売上が50個のときには気温が25℃くらい…?え?」みたいに混乱します。

コーラの売上から気温を予測したい、と思うのはかなり不自然ですよね

ロボ千代

散布図から見えるストーリー

縦軸と横軸を逆にしても違和感がないが、ストーリーが違ってくるものもあります。

身長と体重の散布図を見てみましょう。

縦軸と横軸を入れ替えてもそれほど違和感はないと思います。
ただし、先述したとおり、人間はグラフを見たときに、横軸を「説明変数」、縦軸を「目的変数」と考えるので、この2つの散布図は思い浮かべるストーリーが違ってきます。

左のグラフは、身長から体重を予測したい
右のグラフは、体重から身長を予測したい

という違いになります。

アイ

縦軸と横軸を入れ替えるだけで読み取れるメッセージが違ってくるのは面白いね
グラフを描くときは読み手に対してどのような意図を伝えたいのかを考えて、適切に軸を設定するようにしてくださいね

ロボ千代

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です