반응형
정규분포는 수집된 데이터들의 평균 근처에 값이 모여 있는 연속 확률분포입니다.
먼저 표준편차를 잘 모르시는 분들은 표준편차에 대한 글을 읽고 오시는것을 추천 드립니다.
정규분포는 가우스 분포라고도 불리고 그래프로 그렸을 경우에는 종형곡선(bell curve) 형태를 나타냅니다.
또한 평균이 0이고 표준편차가 1인 정규분포를표준 정규분포라고합니다.
정규분포는 수집된 자료의 분포를 근사하는 데에 자주 사용되며, 이것은 중심극한정리에 의하여 독립적인 확률변수들의 평균은 정규분포에 가까워지는 성질이 있기 때문입니다.
간단한 그림으로 설명해드리겠습니다. (출처: 위키피디아 그림)
위의 그래프에서 뮤(μ)는 평균을, 시그마(σ)는 표준편차를 나타냅니다.
참고: 이 그래프에서는 시그마 제곱을 사용하였기때문에 분포입니다. (하지만 설명하는데에 지장이 되진 않습니다.)
해석
- 표준편차가 클수록 종형곡선은 더 넓고 뭉툭하게 그려지고, 표준편차가 낮을수록 데이터들이 평균값에 더 모여있기 때문에 좁고 날카롭게그려집니다.
- 위의표에서 표준편차가 큰 값은 노란색, 표준편차가 작은값은 파랑색, 표준 정규분포는 빨간색 색상의 그래프를 갖게 됩니다.
반응형
'개발 > DataAnalysis' 카테고리의 다른 글
표준편차 구하기 (0) | 2021.01.24 |
---|