본문 바로가기

자기계발/수학공부

대푯값과 산포도

대푯값과 산포도


1. 대푯값과 평균

(1) 대푯값 : 자료 전체의 특징을 하나의 수로 나타낸 값

(2) 평균(Mean) : 변량의 총합을 변량의 개수로 나눈 값

즉, (평균) = (변량)의 총합 / (변량)의 총 개수

PLUS. 대푯값에는 평균, 중앙값, 최빈값 등이 있으며 그 중에서 평균을 가장 많이 사용한다.


2. 중앙값과 최빈값

(1) 중앙값(Median) : 변량을 작은 값부터 크기순으로 나열했을 때, 중앙에 위치하는 값

- 자료의 개수가 홀수이면 중앙에 놓이는 값이 중앙값이다.

- 자료의 개수가 짝수이면 중앙에 놓이는 두 자료의 평균이 중앙값이다.

(2) 최빈값(Mode) : 변량 중에서 가장 많이 나타나는 값, 즉 도수가 가장 큰 값

- 자료의 값 중에서 도수가 가장 큰 값이 한 개 이상 있으면 그 값이 모두 최빈값이다.

- 각 자료의 값의 도수가 모두 같으면 최빈값은 없다.

(3) 도수분포표에서 중앙값과 최빈값

- 도수분포표에서의 중앙값은 중앙에 위치한 자료의 값이 속하는 계급의 계급값이다.

- 도수분포표에서의 최빈값은 도수가 가장 큰 계급의 계급값이다.


3. 산포도와 편차

(1) 산포도 : 자료 전체가 대푯값을 중심으로 흩어져 있는 정도를 하나의 수로 나타낸 값

PLUS. 자료에서 각 변량이 평균에 가까이 집중되어 있을 수록 산포도가 작아진다.

(2) 편차 : 자료의 한 변량에서 평균을 뺀 값

- 편차의 합은 항상 0이다.

- 평균보다 큰 변량의 편차는 양수이고, 평균보다 작은 변량이 편차는 음수이다.


4. 분산과 표준편차

(1) 분산 : 각 변량의 편차의 제곱의 합을 전체 변량의 개수로 나눈 값, 즉 편차의 제곱의 평균

(분산) = (편차)²의 총합 / (변량)의 개수

(2) 표준편차 : 분산의 양의 제곱근, 즉 (표준편차) = 루트(분산)

PLUS. 표준편차는 가장 널리 쓰이는 산포도이고 표준편차의 단위는 주어진 변량의 단위와 같다.


5. 도수분포표에서의 평균, 분산, 표준편차

(1) (평균) = {(계급값) x (도수)}의 총합 / (도수)의 총합

(2) (분산) = {(편차)² x (도수)}의 총합 / (도수)의 총합

(3) (표준편차) = 루트(분산)


6. 변량의 변화에 따른 평균과 분산, 표준편차의 변화

n개의 변량 x1, x2.. xn의 평균이 m이고 표준편차가 s일 때, 새로운 변량 ax1+b, ... axn+b의

평균과 표준편차는

(1) (평균) = am + b

(2) (표준편차) = |a|s


7. 자료의 분석

두 개 이상의 집단의 잘를 비교할 때, 평균과 표준편차는 각각 다음과 같은 의미로 사용된다.

(1) 집단들의 우열을 비교할 때 평균을 사용한다.

(2) 분산 또는 표준편차가 작다.

- 변량이 평균 가까이에 분포되어 있다.

- 자료의 분포 상태가 고르다.

(3) 분산 또는 표준편차가 크다.

- 변량이 평균에서 멀리 떨어져 있다.

- 자료의 분표 상태가 고르지 않다.

'자기계발 > 수학공부' 카테고리의 다른 글

작도와 합동  (0) 2016.10.27
기본 도형  (0) 2016.10.27
경우의 수와 확률  (0) 2016.10.26
도수분포와 그래프  (0) 2016.10.25
이차함수  (0) 2016.10.25