標準正規分布とは

本記事はスキルチェックリストの[データサイエンス力 No.6]「標準正規分布の分散と平均の値を知っている」に対応しています。
この記事は「分散」の知識があることを前提にしています。分散って何だっけという方は下記の記事もご覧くださいね

ロボ千代

餃子作りで理解するデータの分散と標準偏差

正規分布とは

私たちの身の回りのモノや現象というのは、多かれ少なかれバラツキがあるものです。

身長が高い人もいれば低い人もいます

ロボ千代

アイ

雨の日もあれば晴れの日もあるわ

一言でバラツキがあるといっても、多くの場合、そのバラツキには特徴的な部分があります。

例えば、テストの点数の分布などがそうです。
次のヒストグラムはTOEIC IPテストのスコアの人数分布です。

TOEICスコアの分布

出典:https://www.iibc-global.org/library/default/toeic/official_data/pdf/DAA.pdfを元に筆者がグラフ作成

アイ

キレイな山型をしてるね

平均値付近の人が多く、そこから離れるにつれてだんだん少なくなっていますね。
これは感覚的にも納得の行く形かと思います。

このように平均値を頂点として左右対称にベル型のカーブを描くバラツキ方のことを「正規分布」といいます。

正規分布は英語でNormal distributionと言いますが、このNormalは「ありふれた」とか「どこにでもある」という意味です。
自然界の現象の分布を見てみると、この正規分布によく当てはまるものが多いためです。

例えば、人の身長などの統計を取ると正規分布に近い形になります

ロボ千代

正規分布を確率密度関数で書くとこのようなグラフになります。

正規分布のグラフ

分布の平均値を\(μ\), 分散を\(σ^{2}\)とすると、正規分布は次のような数式で表すことができます。

$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}$$

アイ

なんかごちゃごちゃしてて目がくらむわ

確かにイカつい数式で面食らいそうになりますが、実はよく見るとこの関数の形を決めるのは平均値\(μ\)と分散\(σ^{2}\)です。

平均値\(μ\)を小さくするとグラフの形はそのまま左に移動し、大きくすると右に移動します。

正規分布の平均値を変える

分散\(σ^{2}\)を小さくするとグラフがきゅっと横に縮み、大きくするとのぺっと潰れた形になります。
正規分布の分散を変える

世の中の現象にはいろんな正規分布があり、その形も様々に見えますが、結局のところ平均値\(μ\)と分散\(σ^{2}\)がその形を決めています。

標準正規分布とは

正規分布の形は様々ですが、標準的な形を決めておくと何かと便利です。
そこで標準正規分布というものが定義されています。

標準正規分布とは、平均値=0、分散=1の正規分布のことです。

標準正規分布

この標準正規分布は実際にどんな場面で役立つのかは、「標準化」の記事で詳しく説明します。

まずは標準正規分布は平均0、分散1ということを覚えておいてくださいね

ロボ千代

アイ

OK、すごく覚えやすいわね

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です