반응형
사회조사분석사를 독학하면서, 기출문제로 3회 이상 나온 영역만 골라서 요약하였습니다.
조사방법론II - 표본추출 방법입니다.
표본추출의 의의
- 표본추출(Sampling)이란 전체로서의 모집단(Population)으로부터 부분으로서의 표본을 선택하는 행위 또는 활동이다.
- 표본을 선택하는 과정을 표본추출 또는 표집이라고 하며, 표본추출 과정을 통해 조사대상을 선정한다.
- 모집단을 정확하게 알기 위해서는 이를 전부 다 조사하는 것이 좋지만, 현실적으로 이들을 일일이 조사할 만큼 시간과 예산이 충분하지 못하다.
- 표본추출의 핵심쟁점은 표본의 특성이 전체 대상의 특성을 대표할 수 있는지의 여부, 즉 표본의 대표성이 중요하다.
- 연구자는 전체 집단의 일부에서 얻어진 표본자료를 통해 표본의 특성을 이해하고, 여기에 여러가지 통계 이론과 방법을 동원하여 모집단의 특성을 추론하게 된다.(통계적 추론)
- 표본은 일차적으로 기술적 통계분석의 대상이 되는데, 기술적 통계분석은 모집단을 고려하지 않고 표본 결과만을 고려한다.
- 일부 표본을 대상으로 자료를 수집하는 경우에도, 수집된 처리결과는 모집단을 대상으로 일반화할 수 있어야 한다.
모집단의 개념
- 이론적으로 한정된 실태조사 요소들의 집합을 의미한다.
- 표본추출에 있어서 모집단을 정의할 때는 조사의 내용, 조사의 범위, 시간 등에 대해 명확하고도 한정적으로 규정해야 한다.
- 예를 들어 '우리나라 사람들 전체'는 그 범위가 불확실하고 무한정인 우주인 반면, '2016년 현재 대한민국에 거주하는 사람들 전체'는 한정성을 가지므로 모집단이 된다.
- 모집단 표본추출단위의 유한성 여부에 따라 유한모집단과 무한모집단으로 구분할 수 있다. 여기서 유한모집단은 전체 표본추출단위수를 계산할 수 있는 것을 말하는 반면, 무한모집단을 동전던지기와 같이 표본추출단위수가 끝없이 무한한 모집단을 말한다.
표집틀(표본프레임)
- 표본추출시 필요한 모집단의 구성요소와 표본추출 단계별로 표본추출단위가 수록된 목록을 말한다.
- 표본프레임오차란 모집단과 표본추출 프레임이 일치하지 않으므로 발생하는 오차를 말한다.
- 예를 들어 학생명부로부터 학생들의 단순표본이 추출되었을 경우, 이 학생명부가 바로 표집틀에 해당한다.
- 단순-단계 표본설계에서는 표집틀이 조사의 모집단을 구성하는 요소들의 목록이 된다.
표집오차
- 표집에 의한 모수치의 측정값이 모수치와 다른 정보를 의미한다.
- 표본의 대표성으로부터의 이탈정도를 나타낸다.
표본조사설계의 절차
모집단의 확정 → 표집틀 선정 → 표집방법 결정 → 표집크기 결정 → 표본추출
확률표본추출의 의의
- 확률표본추출은 무작위적인 방법을 통해 표본을 추출하는 방법으로서, 모집단의 각 표집단위가 모두 추출의 기회를 가지고 있으며, 각 표집단위가 추출될 확률을 정확히 알고 있는 가운데 표집을 하는 방법이다.
- 확률표본추출 과정의 핵심으로서 무작위선택은 선택을 할 때마다 독립적으로 모집단의 각 요소가 표본으로 선택될 기회(확률)가 동등하도록 보장한다.
- 예를 들어 모양이 완전한 동전이나 주사위를 사용하는 경우 등이 무작위선택에 의한 확률표본추출방법에 해당한다.
- 확률표본추출의 다표적인 방법으로는 단순무작위표본추출, 계통적표본추출, 층화표본추출, 집락표본추출, 연속표본추출 등이 있다.
단순무작위표본추출
- 단순문작위표본추출의 의의
- 단순무작위표본추출 또는 단순무작위표집은 가장 기본적인 확률표본추출방법으로서, 모집단을 구성하는 각 요인 또는 구성원에 대해 동등한 선택의 기회를 부여하는 과정으로 이루어진다.
- 의식적인 조작이 전혀 없이 표본을 추출함으로써 어떤 요소의 추출이 계속되는 다른 요소의 추출 기회에 아무런 영향을 미치지 않는다.
- 모집단에 대한 정확한 정의와 완전한 목록의 구비를 전제조건으로 한다.
- 표본추출방법
- 모집단과 표집틀을 작성한다.
- 각 구성요소에 고유번호를 부여한다.
- 표본의 크기를 결정한다.
- 무작위로 규정된 표본의 수만큼 표본추출단위를 선정한다. 이때 난수표, 추첨법, 컴퓨터를 이용한 난수의 추출방법 등을 사용할 수 있다.
계통적 표본추출의 의의
- 계통적 표본추출 또는 체계적 표본추출은 모집단 목록에서 구성요소에 대해 일정한 순서에 따라 매 K번째 요소를 추출하는 방법이다.
- 모집단의 총수에 대해 요구되는 표본수를 나눔으로써 표집간격을 구하고 첫 번째 요소를 무작위로 선정하여 최초의 표본으로 삼은 후 일정한 표집간격에 의해 표본을 추출한다.
- 예를 들어 100명의 학생 중 10명을 뽑는다고 할 경우, 매 10번째의 학생을 뽑는다. 다만, 최초의 표본이 3번째 학생으로 무작위선정 되었다면, 13 23 33 43 ... 등이 각각 표본추출 될 것이다. 이때 각 요소 간의 거리에 해당하는 '10'이 표집간격이며, '1/10'이 표집비가 된다.
층화표본추출의 의의
- 모집단을 보다 동질적인 몇 개의 층으로 나눈 후, 이러한 각 층으로부터 단순무작위 표본추출을 하는 방법이다.
- 집단 내 동질적, 집단 간 이질적인 특성을 보인다.
- 이 방법은 모집단의 모수를 추정하는데 있어서 일정한 정확성을 보다 적은 비용으로 확보할 수 있다는 데 그의의가 있다. 이는 동질적인 모집단일수록 이질적인 모집단보다 표본오차가 적다는 논리에 근거한다.
- 전체 모집단에서 표본을 선정하기보다 이미 알고 있는 지식을 이용하여 모집단을 동질적인 부분집합으로 나누고 이들 각각으로부터 적정한 수의 요소를 선정하게 된다.
- 예를 들어 대학생에 관한 연구에서 학년별로 몇 명씩 표본을 선정함으로써, 학년이라는 변수에서 생기는 표본오차는 없앨 수 있는 것이다.
집락표본추출의 의의
- 집락표본추출은 모집단 목록에서 구성요소에 대해 여러 가지 이질적인 구성요소를 포함하는 여러 개의 집락 또는 집단으로 구분한 후 집락을 표집단위로 하여 무작위로 몇 개의 집락을 표본으로 추출한 다음 표본으로 추출된 집락에 대해 그 구성요소를 전수조사하는 방법이다.
- 각 집락이 모집단의 구성요소를 대표할 수 있는 이질적인 요소로 구성되며 집락과 집락들 사이에 차이가 미비한 경우에 적용된다.
- 이러한 집락표본추출을 집단 내 이질적, 집단 간 동질적인 특성을 보인다.
- 집락은 학교나 공장 등과 같은 것이 될 수 있으나, 일반적으로 지역이 집락으로 취급된다. 이 경우 매 면접단위당 비용을 절약하기 위해 광범위한 지역 전체에서 표본추출을 하기 보다는 몇 개의 지역을 추출하여 해당 지역 내에서만 표본을 선정하게 된다.
할당표본추출의 의의
- 할당표본추출 또는 할당표집은 모집단을 일정한 카테고리로 나눈 다음, 이들 카테고리에서 정해진 요소수를 작위적으로 추출하는 방법이다.
- 추출된 표본이 연구자의 모집단에 대한 사전지식을 기초로 하여 모집단의 특성을 나타내는 하위 집단별로 표본수를 할당한 다음 표본을 추출한다.
- 예를 들어 연령, 성별, 교육정도, 소득, 직업 등의 기준을 이용하여 몇몇 카테고리로 분류한 다음 모집단의 특성을 나타낼 수 있도록 특성에 비례하여 각 카테고리를 대표하는 요소수를 할당하고 할당된 사례수를 작위적으로 추출한다.
- 최종적인 표집단위의 선정은 표본설계자가 하지 않고, 일반적으로 현지조사원이 자신의 주관에 따라 한다.
- 각 범주에 할당된 응답자의 비율이 정확해야 하고, 모집단의 구성 비율은 최신의 것이어야 한다.
유의표본추출의 의의
- 유의표본추출은 조사자가 그 조사의 성격상 요구하고 있는 사항을 충족시킬수 있도록 적절한 판단과 전략을 세워 그에 따라 모집단을 대표하는 제 사례를 표본추출하는 방법이다.
- 연구자가 연구목적의 달성에 도움이 되는 구성요소를 의도적으로 추출한다는 점에 목적표본추출 또는 판단표본추출이라고도 한다.
- 연구자가 모집단에 대한 지식이 많은 경우 유용하게 사용된다.
- 연구자의 주관적 판단의 기준에 의거하므로 주관적 판단의 타당도 여부가 표집의 질을 결정한다.
- 건전한 판단과 적절한 전략에 따라 표본을 선정하는 경우 확률표보추출방법에 의한 표본과 비교할 수 있을 정도의 정보를 획득할 수 있다.
- 유의표본추출은 본조사보다는 예비조사, 시험조사 등에 주로 사용된다.
누적표본추출의 의의
- 누적표본추출은 처음에 소수의 인원을 표본으로 추출하여 그들을 조사한 다음, 그 소수인원을 조사원으로 활용하여 그 조사원의 주위 사람들을 조사하는 방식이다.
- 첫 단계에서 연구자가 임의로 선정한 제한된 표본에 해당하는 사람으로부터 추천을 받아 다른 표본을 선정하는 과정을 되풀이하여 마치 눈덩이를 굴리듯이 표본을 누적한다는 의미에서 '스노우볼 표본추출' 또는 '눈덩이 표집'이라고도 한다.
- 연구자가 특수한 모집단의 구성원을 전부 파악하고 있지 못한 경우 또는 비밀을 확인하려는 경우 제한적으로 활용된다.
- 전문가들의 의견조사에 유용하며, 소규모 사회조직의 연구에 적합하다.
- 일반화의 가능성이 낮고 계량화가 곤란하므로 질적 조사에 적합하다.
표준편차
- 표준편차는 점수집합 내에서 점수들 간의 상이한 정도를 나타내는 산포도 측정도구이다.
- 변수값이 평균값에서 어느 정도 떨어져 있는지를 알 수 있도록 한다.
- 표준편차가 클수록 평균값에서 이탈한 것이고, 표준편차가 작을수록 평균값에 근접한 것이다.
- 모표준편차는 표본표준편차는 S로 표기한다.
표본크기의 결정에 영향을 미치는 요소들
- 가용한 자원
- 이론과 조사설계
- 모집단의 변이성
- 표본추출형태 및 조사방법의 형태
- 카테고리의 다양성
- 위험성
오차의 유형
- 표본추출오차 : 표본추출과정에서 발생하는 오차를 말한다.
- 비표본추출오차 : 표본추출 이외의 과정에서 발생하는 오차를 말하는 것으로서, 일반적으로 측정상의 오차를 의미한다.
- 전체오차 : 표본추출과 비표본추출오차로 구성된다.
반응형