ガウス関数
一般にガウス関数とは以下のような形:
$$ a \exp\left\{ -\frac{(x-b)^2}{2 c^2} \right\} $$
正規分布関数
特に正規分布関数とは
$$ N(\mu, \sigma^2) \equiv \frac{1}{\sqrt{2\pi} \sigma} \exp\left\{ – \frac{(x-\mu)^2}{2\sigma^2}\right\}$$ であり,確率統計で最重要かつ中心的役割を果たす。
特に,
$$\int_{-\infty}^{\infty} N(\mu=0, \sigma^2 = 1/2)\, dx = \frac{1}{\sqrt{\pi}} \int_{-\infty}^{\infty} e^{-x^2} dx = 1$$ となり,ガウス積分。
\(\mu, \ \sigma^2 \) が一般の場合でも,\(\displaystyle y \equiv \frac{x-\mu}{\sqrt{2}\sigma}, \ dy = \frac{dx}{\sqrt{2}\sigma} \) という変数変換を行うと,
$$\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi} \sigma} \exp\left\{ – \frac{(x-\mu)^2}{2\sigma^2}\right\} dx =
\frac{1}{\sqrt{\pi}} \int_{-\infty}^{\infty} \exp\left\{ -y^2\right\} dy = 1$$ となる。全区間での積分が1に規格化されていることから,この正規分布関数を確率密度関数とか,確率分布関数ということもある。すべての事象の起こりうる確率を足し上げると,全確率は1になるでしょ。
平均値
確率変数 \(x\) が正規分布 \(N(\mu, \sigma^2)\) に従うとき,\( x\) の平均値 \(\langle x \rangle\) は ( \(\displaystyle y \equiv \frac{x-\mu}{\sqrt{2}\sigma}, \ dy = \frac{dx}{\sqrt{2}\sigma} \) という変数変換を使って)
\begin{eqnarray}
\langle x \rangle &=& \int_{-\infty}^{\infty} x N(\mu, \sigma^2) dx \\
&=& \int_{-\infty}^{\infty}\bigl( (x – \mu) + \mu\bigr) N(\mu, \sigma^2) dx \\
&=& \frac{\sqrt{2}\sigma}{\sqrt{\pi}} \int_{-\infty}^{\infty} y e^{-y^2} dy + \frac{\mu}{\sqrt{\pi}} \int_{-\infty}^{\infty} e^{-y^2} dy \\
&=& \mu
\end{eqnarray}
つまり,\(\mu\) は確率変数 \(x\) の平均値を表す。
分散
また,\( (x-\langle x \rangle)^2\) の平均値である分散は
$$\langle (x-\langle x \rangle)^2 \rangle \equiv \int_{-\infty}^{\infty} (x-\langle x \rangle)^2 N(\mu, \sigma^2) dx = \cdots = \sigma^2$$ であることも簡単にわかる。つまり,\(\sigma^2\) は確率変数 \(x\) の分散を表す。
偏差値
さらには,この分散の平方根 \(\sigma\) を標準偏差といい,これらから以下のような「偏差値」と呼ばれる値が定義される。
$$ T = \frac{10\times(x-\mu)}{\sigma} + 50$$ 昔の受験生(今も?)はこの「偏差値」という値に一喜一憂しながら,受験勉強をしていたのであった。
偏差値 70 は上位何%?
たとえば,偏差値 $70$ といえば,
\begin{eqnarray}
T = 70 &=& \frac{10\times(x-\mu)}{\sigma} + 50 \\
\therefore\ \ x &=& \mu + 2 \sigma
\end{eqnarray}
となる。下のグラフから,$\mu -2 \sigma \leq x \mu + 2 \sigma$ は $95.45\%$ なので,残り $100 – 95.45 = 4.55$ を $2$ で割ると,$4.55/2 = 2.275 \simeq 2.28$ となり,まぁ,上位 $2.28\%$ に入るのが偏差値 $70$ ということになる。
正規分布関数のグラフ