ロボ千代

正規分布とは
私たちの身の回りのモノや現象というのは、多かれ少なかれバラツキがあるものです。
ロボ千代
アイ
一言でバラツキがあるといっても、多くの場合、そのバラツキには特徴的な部分があります。
例えば、テストの点数の分布などがそうです。
次のヒストグラムはTOEIC IPテストのスコアの人数分布です。
出典:https://www.iibc-global.org/library/default/toeic/official_data/pdf/DAA.pdfを元に筆者がグラフ作成
アイ
平均値付近の人が多く、そこから離れるにつれてだんだん少なくなっていますね。
これは感覚的にも納得の行く形かと思います。
このように平均値を頂点として左右対称にベル型のカーブを描くバラツキ方のことを「正規分布」といいます。
正規分布は英語でNormal distributionと言いますが、このNormalは「ありふれた」とか「どこにでもある」という意味です。
自然界の現象の分布を見てみると、この正規分布によく当てはまるものが多いためです。
ロボ千代
正規分布を確率密度関数で書くとこのようなグラフになります。
分布の平均値を\(μ\), 分散を\(σ^{2}\)とすると、正規分布は次のような数式で表すことができます。
$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}$$
アイ
確かにイカつい数式で面食らいそうになりますが、実はよく見るとこの関数の形を決めるのは平均値\(μ\)と分散\(σ^{2}\)です。
平均値\(μ\)を小さくするとグラフの形はそのまま左に移動し、大きくすると右に移動します。
分散\(σ^{2}\)を小さくするとグラフがきゅっと横に縮み、大きくするとのぺっと潰れた形になります。
世の中の現象にはいろんな正規分布があり、その形も様々に見えますが、結局のところ平均値\(μ\)と分散\(σ^{2}\)がその形を決めています。
標準正規分布とは
正規分布の形は様々ですが、標準的な形を決めておくと何かと便利です。
そこで標準正規分布というものが定義されています。
標準正規分布とは、平均値=0、分散=1の正規分布のことです。
この標準正規分布は実際にどんな場面で役立つのかは、「標準化」の記事で詳しく説明します。
ロボ千代
アイ
コメントを残す