Processing math: 100%

1. 정규분포

1) 정규분포

- 연속확률분포 중 가장 많이 활용되는 분포

- 종의 형태로 된 그래프

- 연속확률변수 x의 확률밀도함수 f(x)가 다음과 같이 정해진다

f(x)=1σ2πe12(xμσ)2

- 평균 μ 와 표준편차 σ에 의해 분포가 결정되며 그에 따라 분포의 모양도 달라진다.

 

 

2) 정규분포의 특징

- 특징

① 평균을 중심으로 좌우대칭이며 종 모양( bell shape ) 이다

② 정규분포의 모양은 평균 μ 와 표준편차 σ에 의해 결정된다

③ 평균 = 중앙값 = 최빈값 이다

④ 확률밀도함수 f(x) 의 곡선 아래 부분과 x축 사이의 면적은 항상 1이다.

⑤ 확률밀도함수 f(x) 는 x축에 무한대로 접근하므로 <X<

-예제

평균이 5이고 표준편차가 2인 정규분포의 확률밀도함수 f1(x)

평균이 7이고 표준편차가 1인 정규분포의 확률밀도함수 f2(x) 의 비교

f1(x)=112πe12(x52)2 
f2(x)=112πe12(x71)2

f1(x) : 왼 / f2(x) : 오 

 

3)정규분포의 표준화와 표준정규분포

- 표준화의 목적

정규분포의 확률을 쉽게 구하고 평균과 표준편차가 다른 정규분포를 쉽게 비교하기위해 

- 평균과 표준편차가 다른 확률변수 X에대해 표준화를 식을 구하면 Z=Xμσ

- 표준정규분포 : 표준화를 한 분포, 평균 μ= 0 표준편차 σ = 1인 정규분포 N(0,1) 가 된다.

정규분포를 표준화하여 표준정규분포로 나타낸다

 

 

2. Z 점수

1)Z 점수(Z score) : 표준화식을 통해 얻어진 값

 

2)-Z 점수의 의미 : Z 점수는 확률변수가 평균을 중심으로 몇 배의 표준편차만큼 떨어져있는가를 나타냄

 

3) Z점수의 범위 

-3Z3

-Z>0 일 경우 평균보다 높음

-Z<0 일 경우 평균보다 낮음

-Z=0 일 경우 평균, 0에 가까워 질수록 평균에 가까워짐을 의미

 

4) T 점수

- T=10Z+50

-Z 점수의 음수값, 소수점값을 포함하는 단점을 없앤 표준점수

-Z점수가 평균이 0, 표준편차가 1인 정규분포를 따른다면, T 점수는 평균이 50, 표준편차가 10인 정규분포를 따름

-T 점수의 범위 : 20T80

 

ex1) 평균이 100이고 표준편차가 10인 정규분포 N(100,102) 에 대해 X=150에 대한 Z 점수는?

Z=15010010=5

ex2) A학생이 수학 80점, 영어 90점을 받았다고 할 때, 학교 내 수학, 영어 평균이 같다면 무슨 과목을 더 잘했는지 비교가 쉽지만, 평균과 표준편차가 모두 다르다면 표준화, Z점수가 필요하다.

 

 

3. 표준정규분포표에서의 확률계산

- 표준정규분포 함수의 전체 면적(확률) = 1 , 절반은 0.5

- 표준정규분포표에서는 Z가 0이상의 값을 갖는 경우의 확률만 표시

- y축: 1의 자리와 소수이하 첫째자리

- x축: 소수이하 둘째자리

 

  ex) Z=1.25 일 경우 y축 1.2 와 x축 0.05가 만나는 값이 표준정규분포 함수에서의 0~1.25범위까지의 확률이다. 

 

 

 

4. 다양한 표준정규분포의 확률계산

1) 정규분포의 확률계산

① 문제에서 계산하려는 확률(면적)을 정규분포상에 표시

② 표준화를 통해 계산하려는 확률(면적)을 표준정규분포상에 표시

ex) 평균 350000인 정규분포를 그리고 400000 이상의 확률을 구하라

Z=4000003500005000=1
P(0Z1)=0.3413
0.50.3413=0.1587

 

2) 확률변수 X값을 찾는 방법

ex) 100명 학생의 수학성적은 평균이 75, 표준편차가 10인 정규분포를 따른다고 할 때 상위 10%에 들기위해 최소 몇 점을 받아야 하는가?

상위 10% = P(XXa)=0.1=Xa이상의 범위가 0.1인 것

P(0ZZa)=0.4 를 만족하는 Za를 찾는다

P(0Z1.2)=0.3997 이므로 Za=1.28

1.28=Xa7510

Xa=88 한 학생이 상위 10%안에 들기 위해서는 최소 88점을 받아야 한다.

P(X88)=P(Z1.28)=0.1 

 

 

5. 엑셀의 활용

1) 정규분포의 확률밀도함수나 누적확률  

=NORMSDIST (x, mean, standard_dev, cumulative)
X: 확률변수 , mean : 평균, standard_dev: 표준편차, cumulative (1 : 누적분포확률) (2 : 밀도 함수)

누적확률

1) 표준정규분포의 누적분포값, 누적확률

=NORMDIST (z)
z: 확률변수

ex) 표준정규분포에 대해 P(1.5Z2)
=NORMSDIST(2) - NORMSDIST(-1.5) = 0.910443..

 

+ Recent posts