정규분포
조무위키
이 문서는 이과가 작성했거나, 또는 이과에 대해 다룹니다. 무슨 생각으로 작성한 건지는 잘 모르겠습니다만 맞는말임은 틀림 없습니다. 이과는 아다를 못 떼 마법을 쓰니까 말이죠... |
Normal Distribution
확통에서 존나 개꿀인 파트
수학[편집]
확률밀도함수(probability density function, pdf)중 하나다. 급식 수준의 통계학을 배울때부터 나온다는 점에서부터 이놈의 중요성은 설명하지 않아도 아리라 생각한다.
보통 그리면 종 모양(bell-shaped)으로 생겼는데 종 가운데의 지점을 평균(mean, μ)이라고 한다. 종의 모양은 표준편차값(standard deviation, σ)에 따라 달라진다. 이놈의 적분이 곧 그 확률변수 구간에서의 확률을 나타낸다.
근데 이놈은 초등함수 적분이 불가능한 대표적인 함수 중에 하나라서 급식 수준에서는 그냥 표준정규분포(standard normal distribution; μ=0, σ^2=1)로 근사한 후 표준정규분포표를 갖고 확률을 구할거다.
즉 확률변수(random variable) Y가 N(μ, σ^2)를 따를 때 (<==> Y~N(μ, σ^2)), Z=(Y-μ)/σ ~ N(0, 1)가 성립한다.
증명 1:
Y~N(μ, σ^2)라고 하고 Z = (Y-μ)/σ로 정의하자. 즉 Z = Y/σ - μ/σ다. 이 식을 Y에 대해 정리하면 Y = σZ + μ (=(h^-1)(Z))가 나온다.
f_Y(y)를 Y의 pdf, f_Z(z)를 Z의 pdf라고 하자. (h^-1)(z) = σz + μ는 증가함수이고 (∵ σ > 0) 모든 y (-∞ < y < ∞)에 대해 f_Y(y) > 0이므로
f_Y(y)=(1/(σsqrt(2pi)))exp(-((y-μ)^2)/(2σ^2)) (-∞ < y < ∞) => f_Z(z) = f_Y((h^-1)(z))|dh^-1/dz| (-∞ < σz +μ < ∞ => -∞ < z < ∞)이다.
즉 f_Z(z) = f_Y(σz +μ)|σ| (∵dh^-1/dz = d/dz [σz + μ] = σ) = σf_Y(σz +μ) (∵ σ > 0)임을 알 수 있다.
그런데 f_Y(σz +μ) = (1/(σsqrt(2pi)))exp(-((σz +μ-μ)^2)/(2σ^2)) = (1/(σsqrt(2pi)))exp(-(σ^2)(z^2)/(2σ^2))
= (1/(σsqrt(2pi)))exp(-(z^2)/(2))이므로 σf_Y(σz +μ) = (1/sqrt(2pi))exp(-(z^2)/(2))다.
결국 f_Z(z) = (1/sqrt(2pi))exp(-(z^2)/(2))이고, 이는 Z~N(0, 1)임을 보인다. ▯
증명 2:
m_Y(t) = exp(μt + 0.5(σ^2)(t^2)) 이므로 m_Z(t) = E(exp(tZ)) = E(exp(t(Y-μ)/σ)) = E(exp((t/σ)Y))E(exp(-μt/σ))
= exp(-μt/σ) * m_Y(t/σ) = exp(-μt/σ) * exp(μt/σ + 0.5(σ^2)(t/σ)^2)
= exp(-μt/σ + μt/σ + 0.5(t)^2) = exp(0 * t + 0.5(1^2)(t^2)). 따라서 Z~N(0, 1)임을 보인다. ▯
증명 3:
P(Y <= x) = int -∞ to x; (1/(σsqrt(2pi)))exp(-((t-μ)^2)/(2σ^2)) dt 이므로,
P(Z <= x) = P((Y-μ)/σ <= x) = P(Y-μ <= σx) = P(Y <= σx + μ) = int -∞ to (σx + μ); (1/(σsqrt(2pi)))exp(-((t-μ)^2)/(2σ^2)) dt
여기서 s = (t-μ)/σ 라고 하면 ds = dt/σ 이고 t = σx + μ => s = (σx + μ-μ)/σ = x 이므로, 정리하면
P(Y <= σx + μ) = int -∞ to (x); (1/(sqrt(2pi)))exp(-(s/sqrt(2))^2) ds = int -∞ to x; (1/(sqrt(2pi)))exp(-(s^2)/2) ds.
즉 P(Z <= x) = int -∞ to x; (1/(sqrt(2pi)))exp(-(s^2)/2) ds 이여서 Z~N(0, 1)이다. ▯
특징:
(1) Y~N(μ, σ^2)일때 Y의 pdf f(y)는 y = μ±σ에서 convexity가 바뀐다. μ-σ<y<μ+σ 일 때 f(y)는 concave하고 그 외에는 convex하다.
(2) Z~N(μ=0, σ^2=1) => max{f(z) | -∞ < z < ∞} = 1/sqrt(2π) ≈ 0.4
다행히도 학식 이상에서는 이놈을 적분할 방법이 여러가지 나오므로 혹시 이걸 적분해보고 싶어 미치겠는 잉여라면 대학 미적분학을 열람하도록.
사실 가장 중요한 점은 바로 성급한 일반화의 오류충들을 아닥하게 만드는 함수라는 거다. 성급한 일반화의 오류충들에게 이걸 들이대고 그런 놈이 대부분이라는 것을 입증하면 전부 다 버로우한다. 즉, 팩트폭력의 재료 중 하나라는 것이다.
ㄴ정규분포는 여러가지 모수들의 추정량을 나타내는 좋은 형태의 분포지만 초급통계에서나 먹히지 직접분석해보면 정규분포,t-분포,카이스퀘어 분포 등 정규분포 기반으로 만들어지 검정 추정방식들은 표본이 작거나 편향적인 데이터 즉 일반적인 데이터에서 표본으로부터 모집단의 특징을 충분히 반영하지 못하는 경우가 많다. 고로 정규분포검정에서 H0를 기각시켰다고 그게 사실이라고 하는것이 더 일반화의 오류이다.