반응형
사회조사분석사를 독학하면서, 기출문제로 3회 이상 나온 영역만 골라서 요약하였습니다.
사회통계 - 기술통계입니다.
위치적 대표값(구체적 대표값)
- 중위수
- 통계집단의 측정값을 크기순으로 배열했을 때 중앙에 위치한 수치를 말한다.
- X의 중위수를 Me라 하면 n이 홀수일 경우 중위수는 (n+1)/2번째의 값이 되고, n이 짝수일 경우 중위수는 n/2번째의 값과 (n/2)+1번째의 값의 평균값이 된다.
- 극단적인 값의 영향을 받지 않으며, 중위수에 대한 편차의 절대치의 합은 다른 어떤 수에 대한 편차의 절대치의 합보다 작다.
- 분포모양이 비대칭인 경우에는 중앙값이 산술평균이나 최빈수보다 자료의 대표성을 높일 수 있다.
- 분포모양이 대칭일 경우에는 중앙값과 산술평균은 일치한다.
- 수리적으로 다루기가 불편하므로 극단적인 값을 피해야 하는 경우를 제외하고는 거의 사용하지 않는다.
- 기하학적인 중위수는 히스토그램을 똑같은 면적으로 나눈 수직선에 대응하는 x의 값이 된다.
- 경기변동을 산출할 때 사용한다.
- 정렬된 순서 통계량중에서 배열상 50%에 위치한 값이다.
- 관측치의 분포가 극도로 편재되어 있는 경우에 많이 사용한다.
- 최빈수(Mode)
- 변량 X의 측정값 중에서 출편도수가 가장 많은 값을 말한다. 도수분포표에서는 도수가 가장 많은 계급의 계급값이 최빈수가 된다.
- 통계집단에서 가장 많이 나타나는 변량의 값으로 '모드'라고도 한다. 즉, 도수분포에서 최대의 도수를 가지는 변량의 값이다.
- 최빈수는 빈도수가 가장 많이 발생한 관찰값이므로 중위수와 마찬가지로 자료 가운데 극단적인 이상점에 영향을 받지 않는다.
- 최빈수는 가장 쉽게 알아낼 수 있는 대표값이고, 같은 관측치를 나타내는 관찰대상의 규모 등을 파악하고자 할 때 자주 이용되는 대표값이다.
- 분포모양이 좌우 대칭일 때에는 최빈수가 대체로 대표성이 있으며, 최빈수는 전형적인 값이므로 가장 납득하기 쉬운 대표값이다.
- 경우에 다라 하나도 없거나 두 개 이상 존재할 수도 있다.
- 의류에서 기성복의 치수 등을 정하는 경우에 사용하기 적당하다.
- 사분위수 : 변량 X의 n개의 측정값을 작는 것 부터 크기순으로 배열하였을 때 전체 측정값을 4등분하는 위치에 오는 값
반응형