1. 정규분포

1) 정규분포

- 연속확률분포 중 가장 많이 활용되는 분포

- 종의 형태로 된 그래프

- 연속확률변수 x의 확률밀도함수 f(x)가 다음과 같이 정해진다

$f(x) = \frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}(\frac {x-\mu}{\sigma})^2}$

- 평균 $\mu$ 와 표준편차 $\sigma$에 의해 분포가 결정되며 그에 따라 분포의 모양도 달라진다.

 

 

2) 정규분포의 특징

- 특징

① 평균을 중심으로 좌우대칭이며 종 모양( bell shape ) 이다

② 정규분포의 모양은 평균 $\mu $ 와 표준편차 $\sigma $에 의해 결정된다

③ 평균 = 중앙값 = 최빈값 이다

④ 확률밀도함수 f(x) 의 곡선 아래 부분과 x축 사이의 면적은 항상 1이다.

⑤ 확률밀도함수 f(x) 는 x축에 무한대로 접근하므로 $-\infty < X <\infty$

-예제

평균이 5이고 표준편차가 2인 정규분포의 확률밀도함수 $f_1(x)$

평균이 7이고 표준편차가 1인 정규분포의 확률밀도함수 $f_2(x)$ 의 비교

$f_1(x)=\frac{1}{1\sqrt{2 \pi }}e^{-\frac{1}{2}(\frac{x-5}{2})^2}$ 
$f_2(x)=\frac{1}{1\sqrt{2 \pi }}e^{-\frac{1}{2}(\frac{x-7}{1})^2}$

f1(x) : 왼 / f2(x) : 오 

 

3)정규분포의 표준화와 표준정규분포

- 표준화의 목적

정규분포의 확률을 쉽게 구하고 평균과 표준편차가 다른 정규분포를 쉽게 비교하기위해 

- 평균과 표준편차가 다른 확률변수 X에대해 표준화를 식을 구하면 $Z= \frac{X- \mu}{\sigma }$

- 표준정규분포 : 표준화를 한 분포, 평균 $\mu$= 0 표준편차 $\sigma $ = 1인 정규분포 $N(0,1)$ 가 된다.

정규분포를 표준화하여 표준정규분포로 나타낸다

 

 

2. Z 점수

1)Z 점수(Z score) : 표준화식을 통해 얻어진 값

 

2)-Z 점수의 의미 : Z 점수는 확률변수가 평균을 중심으로 몇 배의 표준편차만큼 떨어져있는가를 나타냄

 

3) Z점수의 범위 

-$-3 \leq Z \leq 3$

-$Z>0$ 일 경우 평균보다 높음

-$Z<0$ 일 경우 평균보다 낮음

-$Z=0$ 일 경우 평균, 0에 가까워 질수록 평균에 가까워짐을 의미

 

4) T 점수

- $T= 10Z+50$

-Z 점수의 음수값, 소수점값을 포함하는 단점을 없앤 표준점수

-Z점수가 평균이 0, 표준편차가 1인 정규분포를 따른다면, T 점수는 평균이 50, 표준편차가 10인 정규분포를 따름

-T 점수의 범위 : $20  \leq T \leq 80$

 

ex1) 평균이 100이고 표준편차가 10인 정규분포 $N(100,10^2)$ 에 대해 X=150에 대한 Z 점수는?

$Z = \frac{150-100}{10}=5$

ex2) A학생이 수학 80점, 영어 90점을 받았다고 할 때, 학교 내 수학, 영어 평균이 같다면 무슨 과목을 더 잘했는지 비교가 쉽지만, 평균과 표준편차가 모두 다르다면 표준화, Z점수가 필요하다.

 

 

3. 표준정규분포표에서의 확률계산

- 표준정규분포 함수의 전체 면적(확률) = 1 , 절반은 0.5

- 표준정규분포표에서는 Z가 0이상의 값을 갖는 경우의 확률만 표시

- y축: 1의 자리와 소수이하 첫째자리

- x축: 소수이하 둘째자리

 

  ex) Z=1.25 일 경우 y축 1.2 와 x축 0.05가 만나는 값이 표준정규분포 함수에서의 0~1.25범위까지의 확률이다. 

 

 

 

4. 다양한 표준정규분포의 확률계산

1) 정규분포의 확률계산

① 문제에서 계산하려는 확률(면적)을 정규분포상에 표시

② 표준화를 통해 계산하려는 확률(면적)을 표준정규분포상에 표시

ex) 평균 350000인 정규분포를 그리고 400000 이상의 확률을 구하라

$Z = \frac {400000-350000}{5000}= 1$
$P(0  \leq Z \leq 1) = 0.3413$
$0.5-0.3413= 0.1587$

 

2) 확률변수 X값을 찾는 방법

ex) 100명 학생의 수학성적은 평균이 75, 표준편차가 10인 정규분포를 따른다고 할 때 상위 10%에 들기위해 최소 몇 점을 받아야 하는가?

상위 10% = $P(X\geq X_a) = 0.1 = X_a$이상의 범위가 0.1인 것

① $P(0 \leq Z\leq Z_a)= 0.4$ 를 만족하는 $Z_a$를 찾는다

$P(0 \leq Z \leq 1.2)= 0.3997$ 이므로 $Z_a=1.28$

③ $1.28=\frac {X_a-75}{10}$

④ $X_a=88$ 한 학생이 상위 10%안에 들기 위해서는 최소 88점을 받아야 한다.

$P(X\geq 88)=P(Z\geq 1.28) = 0.1$ 

 

 

5. 엑셀의 활용

1) 정규분포의 확률밀도함수나 누적확률  

=NORMSDIST (x, mean, standard_dev, cumulative)
X: 확률변수 , mean : 평균, standard_dev: 표준편차, cumulative (1 : 누적분포확률) (2 : 밀도 함수)

누적확률

1) 표준정규분포의 누적분포값, 누적확률

=NORMDIST (z)
z: 확률변수

ex) 표준정규분포에 대해 $P(-1.5 \leq Z \leq 2) 계산$
=NORMSDIST(2) - NORMSDIST(-1.5) = 0.910443..

 

+ Recent posts