1. 정규분포
1) 정규분포
- 연속확률분포 중 가장 많이 활용되는 분포
- 종의 형태로 된 그래프
- 연속확률변수 x의 확률밀도함수 f(x)가 다음과 같이 정해진다
$f(x) = \frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{1}{2}(\frac {x-\mu}{\sigma})^2}$
- 평균 $\mu$ 와 표준편차 $\sigma$에 의해 분포가 결정되며 그에 따라 분포의 모양도 달라진다.
2) 정규분포의 특징
- 특징
① 평균을 중심으로 좌우대칭이며 종 모양( bell shape ) 이다
② 정규분포의 모양은 평균 $\mu $ 와 표준편차 $\sigma $에 의해 결정된다
③ 평균 = 중앙값 = 최빈값 이다
④ 확률밀도함수 f(x) 의 곡선 아래 부분과 x축 사이의 면적은 항상 1이다.
⑤ 확률밀도함수 f(x) 는 x축에 무한대로 접근하므로 $-\infty < X <\infty$
-예제
평균이 5이고 표준편차가 2인 정규분포의 확률밀도함수 $f_1(x)$
평균이 7이고 표준편차가 1인 정규분포의 확률밀도함수 $f_2(x)$ 의 비교
$f_1(x)=\frac{1}{1\sqrt{2 \pi }}e^{-\frac{1}{2}(\frac{x-5}{2})^2}$
$f_2(x)=\frac{1}{1\sqrt{2 \pi }}e^{-\frac{1}{2}(\frac{x-7}{1})^2}$
3)정규분포의 표준화와 표준정규분포
- 표준화의 목적
정규분포의 확률을 쉽게 구하고 평균과 표준편차가 다른 정규분포를 쉽게 비교하기위해
- 평균과 표준편차가 다른 확률변수 X에대해 표준화를 식을 구하면 $Z= \frac{X- \mu}{\sigma }$
- 표준정규분포 : 표준화를 한 분포, 평균 $\mu$= 0 표준편차 $\sigma $ = 1인 정규분포 $N(0,1)$ 가 된다.
2. Z 점수
1)Z 점수(Z score) : 표준화식을 통해 얻어진 값
2)-Z 점수의 의미 : Z 점수는 확률변수가 평균을 중심으로 몇 배의 표준편차만큼 떨어져있는가를 나타냄
3) Z점수의 범위
-$-3 \leq Z \leq 3$
-$Z>0$ 일 경우 평균보다 높음
-$Z<0$ 일 경우 평균보다 낮음
-$Z=0$ 일 경우 평균, 0에 가까워 질수록 평균에 가까워짐을 의미
4) T 점수
- $T= 10Z+50$
-Z 점수의 음수값, 소수점값을 포함하는 단점을 없앤 표준점수
-Z점수가 평균이 0, 표준편차가 1인 정규분포를 따른다면, T 점수는 평균이 50, 표준편차가 10인 정규분포를 따름
-T 점수의 범위 : $20 \leq T \leq 80$
ex1) 평균이 100이고 표준편차가 10인 정규분포 $N(100,10^2)$ 에 대해 X=150에 대한 Z 점수는?
$Z = \frac{150-100}{10}=5$
ex2) A학생이 수학 80점, 영어 90점을 받았다고 할 때, 학교 내 수학, 영어 평균이 같다면 무슨 과목을 더 잘했는지 비교가 쉽지만, 평균과 표준편차가 모두 다르다면 표준화, Z점수가 필요하다.
3. 표준정규분포표에서의 확률계산
- 표준정규분포 함수의 전체 면적(확률) = 1 , 절반은 0.5
- 표준정규분포표에서는 Z가 0이상의 값을 갖는 경우의 확률만 표시
- y축: 1의 자리와 소수이하 첫째자리
- x축: 소수이하 둘째자리
ex) Z=1.25 일 경우 y축 1.2 와 x축 0.05가 만나는 값이 표준정규분포 함수에서의 0~1.25범위까지의 확률이다.
4. 다양한 표준정규분포의 확률계산
1) 정규분포의 확률계산
① 문제에서 계산하려는 확률(면적)을 정규분포상에 표시
② 표준화를 통해 계산하려는 확률(면적)을 표준정규분포상에 표시
ex) 평균 350000인 정규분포를 그리고 400000 이상의 확률을 구하라
$Z = \frac {400000-350000}{5000}= 1$
$P(0 \leq Z \leq 1) = 0.3413$
$0.5-0.3413= 0.1587$
2) 확률변수 X값을 찾는 방법
ex) 100명 학생의 수학성적은 평균이 75, 표준편차가 10인 정규분포를 따른다고 할 때 상위 10%에 들기위해 최소 몇 점을 받아야 하는가?
상위 10% = $P(X\geq X_a) = 0.1 = X_a$이상의 범위가 0.1인 것
① $P(0 \leq Z\leq Z_a)= 0.4$ 를 만족하는 $Z_a$를 찾는다
② $P(0 \leq Z \leq 1.2)= 0.3997$ 이므로 $Z_a=1.28$
③ $1.28=\frac {X_a-75}{10}$
④ $X_a=88$ 한 학생이 상위 10%안에 들기 위해서는 최소 88점을 받아야 한다.
$P(X\geq 88)=P(Z\geq 1.28) = 0.1$
5. 엑셀의 활용
1) 정규분포의 확률밀도함수나 누적확률
=NORMSDIST (x, mean, standard_dev, cumulative)
X: 확률변수 , mean : 평균, standard_dev: 표준편차, cumulative (1 : 누적분포확률) (2 : 밀도 함수)
1) 표준정규분포의 누적분포값, 누적확률
=NORMDIST (z)
z: 확률변수
ex) 표준정규분포에 대해 $P(-1.5 \leq Z \leq 2) 계산$
=NORMSDIST(2) - NORMSDIST(-1.5) = 0.910443..
'School Activities > Math' 카테고리의 다른 글
[확률과 통계]결합,주변,조건부,독립 확률분포 (0) | 2019.10.18 |
---|---|
[확률과 통계] 확률변수와 확률분포 , 척도 (0) | 2019.10.12 |
[확률과 통계] 대푯값과 산포도 (0) | 2019.10.12 |
[확률과 통계] 그래프 그리기 (0) | 2019.10.12 |