한눈에 보이는 마케팅

[조사 / 리서치] 알기 쉬운 통계 : 모집단, 표본, 평균, 표준편차, 분산 이해하기

마케팅 여행 2012. 4. 10. 18:28

알기 쉬운 통계 : 모집단, 표본, 평균, 표준편차, 분산 이해하기

[조사 / 리서치] [마케팅]

모집단은 관심있는 어떤 특성에 대해 조사한 모든 자료의 집합을 말하는 것으로,

어떤 집단을조사할 경우에 관찰의 대상이 되는 집단 전체를 전수 조사하는 것이불가능하거나 어려워서전체중의일부를 추출하여조사함으로써 전체의 성질을 추정하는 표본조사 방법을 시행한다. 이와 같은 경우 원래의 집단 전체를 모집단이라 하고, 추출된 일부를 표본이라고 한다.

모집단은통계의 대상이 되는인간의 집단뿐만 아니라추상의 과정도 의미하게 되었다. 예를 들면, 공기오염도의 측정을 위해 시간대별로 측정한 측정치가 있다면 이러한 측정치의 집합을 의미한다.

모집단의 평균은 모평균, 분산은 모분산, 표준편차는 모표준편차가 있다.

표본은 모집단에서 추출한 일부 자료들의 집합을 의미하는데,

예를 들어, 국민건강조사를 위해 전국민을 조사한다면 전수조사가 되는 것이고, 전국민에서 일부를 추출하여 조사를 시행하고 전국민을 추정한다면 표본조사인 것이다. 이 때 추출되는 일부 국민을 표본이라고 한다.

표본 추출 방법에 대한 것은 추후 별도로 논의하기로 한다.

평균은 산술평균과 가중평균으로 나누어지는데,

산술평균은 자료 전체의 합계를 자료의 총 개수로 나눈 값을 의미하며,

가중평균은 자료의 중요성이 다른 경우에, 각 자료에 가중치를 곱하고 난 다음에 이들 모두를 합한 값을 가중치의 합계로 나눈 것을 말한다.

평균이 의미하는 것은 널리 퍼져있는 자료들의 대표하는 수로 보통은 평균 주변에 자료들이 분포하는 경향이 있다. 그리고 빈도가 높은 자료는 평균에 많은 영향을 준다는 점과 자료들이 좌우대칭을 이룰 경우에는 평균은 대칭이 되는 축이 된다.

분산과 표준편차는 자료가 얼마나 흩어져서 있는지를 알아보는 것이다.

각 자료와 평균과의 차이를 편차(deviation)라고 하며,

분산(variance)은 자료가 퍼져있는 상태를 나타내는 값으로, 편차의 제곱들을 합한 다음에 전체 자료 수로 나누면 된다. 편차제곱을 하는 이유는 +편차와 -편차가 있기 때문에 이를 모두 합하면 0이 된다. 따라서 0이 되는 것을 방지하기 위함이다. 물론 자료가 평균과 모두 같다면 분산은 0이 된다. 분산의 값이 0에 가까우면 자료들의 흩어짐이 적으며, 분산값이 크면 클수록 평균에서 많이 흩어져 있음을 의미한다. 그러나 분산은 제곱을 함으로써 수치가 커지고 자료의 원 단위와단위가 달라지는(키 자료인 cm를 제곱하면 면적 단위인 ㎠로 바뀜) 문제를 갖고 있다. 이 문제를 해결하기 위해서 표준편차를 쓰게 된다.

표준편차(standard deviation)는 분산에 루트를 씌움으로써 편차들의 평균값으로 받아들일 수 있고 단위도 원자료의 단위와 동일해진다.

분산과 표준편차는 음수가 나올 수 없고, 자료가 모두 동일하면 0이 되며, 자료가 많이 흩어져 있을수록 커지고, 평균에 근접해 있을수록 작아지는 특성을 갖는다.

평균과표준편차의 관계는 위에서 설명하였으니 우리 실생활에서 어떤 의미를 갖는지를 보기로 한다.

A, B라는 두 개 국가의 1인당 국민소득이 3만달러로 동일하다면,

즉, 1인당 국민소득의 평균은 3만달러로 동일하다고 해서 국민들의 생활수준이 동일하다고 할 수 있겠는가?

절대로 그렇게말할 수 없다는 것에 평균의 단점이 있는 것이다.

A라는 국가는 대부분의 국민이 3만달러 정도를 벌고 있어서 평균이 3만달러이기에 모두가 잘 산다고 할 수 있다.

그러나 B라는 국가는 5천달러도 못버는 국민이 30%정도이고, 5만5천달러 이상을 버는 국민이 30%정도이어서 평균이 3만불이 나왔다면 빈부의 격차가 극심한 나라인 것이다.

이런 경우에 두 나라의 국민소득은 동일하지만 국민들의 생활 수준이나 방식은 천지차이가 나기 때문에, 이러한 현상을 파악하려면 평균의 의미도 봐야겠지만 표준편차의 의미가 더욱 중요한 상황이 된다.

이 정도로 개념을 파악하고, 다음으로는 리서치에서 모집단을 추정할 때의 대표성과 관련된 표본 추출 방법에 대해 보기로 한다.