[GUI] 표본조사와 전수조사

2022. 5. 12. 22:222022/GUI

반응형
 

서울여대 김예리 교수님의 'GUI를 활용한 데이터사이언스' 수업을 듣고 작성한 복습용 글입니다.

교재: 마케팅조사원론


1. 표본조사와 전수조사

1) 설문지 작성 시 조사 계획을 수립해야 하는데 이때 전수조사와 표본조사 중 조사방법을 결정해야 한다. 이때 모집단의 규모와 성격, 조사예산, 표본오류와 비표본오류를 고려하여 결정해야 한다.

표본조사 조사방법 전수조사
모집단 내에 포함된 모든 대상을 조사하는 방식
ex) 인구주택총조사
(총조사: 모집단의 양상을 파악하여 국가정책 수립의 기초 자료로 활용)
특징 표본의 특성을 기반으로 모집단의 특성을 추정하는 방식
*표집: 모집단의 일부인 표본을 추출하는 과정
표본오차 없음 장점 비용절감, 신속성
시간과 비용 많이 소요 단점 일반화 제약, 편향된 조사 가능성 존재

2) 오류의 종류

오류
표본오류 비표본오류
모집단을 대표할 표본단위들이 추출되지 못하는 경우 발생
표본의 크기가 증가할수록 표본 오류의 크기 감소
조사 대상자들로부터 자료수집 과정에서 발생
전수조사, 표본조사 모두 발생하며 조사 대상이 많을수록 증가
비관찰오류 관찰오류
불포함오류 무응답오류 조사현장에서의 오류 자료처리상에서의 오류

2. 표본추출 과정

1) 모집단 설정

-조사대상이 되는 모집단 결정.

*모집단: 조사자의 관심 대상이 되는 사람, 제품, 기업, 지역 등의 집합체로 조사자가 직접적인 방법이나 통계적 추정에 의해 정보를 얻으려는 대상 집단

e.g. 대통령 선거 유권자 조사를 실시하는 경우의 모집단

      -> 투표일 현재 대한민국에 거주하는 만 19세 이상의 일반 국민

 

2) 표본 프레임 선정

*표본프레임: 모집단 내 조사 대상들의 명단이 수록된 목록 -> 최종적인 표본을 추출하는 목록

e.g. 행정구역 편람에 수록된 우리나라 읍면동에 대한 목록

 

-표본 프레임의 조건

  • 모집단에 누락이 있으면 오류 발생
  • 중복된 대상이 있는 경우 표본 추출 가능성이 높아져 오류 발생 -> 중복으로 포함하지 않는 것이 좋음
  • 실제 접촉할 수 있는 정확한 정보가 있어야 조사에 사용 가능
  • 대표성이 확보되어야 함 -> 신뢰성, 타당성 확보를 위한 조건

-표본프레임의 오류

표본프레임이 모집단 내에 포함되는 경우 모집단이 표본프레임 내에 포함되는 경우 모집단과 표본프레임의 일부만이 일치하는 경우
일부 모집단의 특성을 반영할 수 없는 오차 발생 표본프레임 내에 속해있는 구성요소 중 모집단에 속해있지 않는 부분이 표본으로 선정될 수 있기 때문에 오차 발생 표본의 대표성이 떨어지고 자료의 검토나 편집 과정도 어려워 가장 심각한 표본 프레임 오차 발생
e.g. 모집단이 대한민국 국민일 때 전화번호부를 사용하는 경우 e.g. 모집단이 연간 3000만원 이상 카드 사용자일 때 카드 소지자 전체를 표본프레임으로 사용하는 경우 e.g. 자동차 선호도를 조사할 때 전화번호부를 사용하는 경우
표본프레임은 모집단과 일치하는 것이 이상적이지만 현실적으로 모집단과 일치하는 표본프레임을 얻는 것은 불가능
표본 프레임 자체가 존재하지 않는 경우도 많음
대부분 상업적 조사에서 표본프레임이 필요없는 비확률표본추출방법을 이용

3) 표본추출방법 결정

확률 표본추출방법 방법 비확률 표본추출방법
모집단을 구성하는 대상들의 명단이 개재된 표본프레임을 이용해 표본을 추출 정의 표본프레임이 없어 모집단 내의 대상들이 선택될 확률을 사전에 모르는 상태에서 표본이 선정되는 방법
모집단 내의 각 대상들이 선택 될 확률을 미리알 수 있음
표본추출과정에서 발생되는 오류의 정도 또한 추정이 가능함
특징 추출된 표본이 모집단을 얼마나 잘 대표하는지, 조사 결과에서 어느정도의 오류가 발생할 것인지 제시 불가
본 표본조사의 결과는 모집단 내의 대상을 모두 조사했을 경우와 비교해 약 +-2% 이내의 차이가 발생할 확률이 95% 정도입니다.  
표본의 수가 많지않고 표본 프레임 입수가 가능한 경우 이용 모집단의 규모가 큰 경우

*비확률 표본 추출방법

편의표본추출법 판단표본추출법 할당표본추출법
- 가장 간단한 형태의 표본 추출법
- 임의로 선정한 지역/시간대에 원하는 사람들을 표본으로 선택
- 조사 문제를 잘 알거나 모집단의 의견을 반영할 수 있을 것으로 판단되는 특정 집단을 표본으로 선택하는 방법 - 상업적 마케팅조사에서 가장 많이 사용되는 방법
- 정해진 분류기준으로 전체 표본을 여러집단으로 구분하고 집단별로 필요한 대상을 추출하는 방법
- 사전에 모집단의 특성을 파악하여 표본할당을 기준으로 활용
- 특정 대학 앞에서 지나가는 대학생에게 협조를 구해 조사
- 지나가는 행인을 대상으로 의견을 물어보는 경우
- 일반 소비자는 이해하지 못할 수 있는 경우 관련 분야 전문가는 유경험자를 대상으로 조사

e.g. 스노우볼 표본추출법
(접촉한 대상자들에게 유사한 지식을 가진 다른 대상자를 소개받는 방식)
- 구매고객의 연령별 비율을 고려하여 표본을 추출
- 비용이 저렴
- 절차가 간단
-적은 비용으로 의미있는 자료를 수집 - 모집단의 대표성 확보 가능
: 집단분류기준을 잘 선정하면 모집단 대표성 확보 가능
- 모집단의 특성 반영 가능
: 각 집단 표본크기가 충분히 큰 경우 집단별 측정자료는 정규분포를 가져 모집단 특성을 반영할 수 있음
+ 오류정도를 계산 가능
- 추출된 표본이 모집단을 대표하지 못함
- 응답을 거부하는 사람들의 특성 반영 불가
-모집단의 특성 대표 불가  

*확률표본추출방법

4) 표본 크기 결정

  • 표본의 크기는 조사비용, 조사 정확도와 밀접한 관련이 있음
  • 표본추출 크기를 결정할 때 연구 목적과 조사 유형, 조사예산, 시간제약 등을 고려해야 함

*신뢰구간을 이용한 표본 크기 결정

: 조사자가 허용하는 자료의 오차의 범위와 신뢰수준을 결정하면 이를 근거로 표본의 크기를 결정하는 것

 

 1. 허용할 수 있는 오차의 범위(E)를 결정

e.g. 모집단의 참값 +-5%

 

 2. 신뢰수준 결정

e.g. 95% 또는 99% 수준에서 믿을 수 있는지 결정

 

 3. 정규분포 하에 2에서 결정한 신뢰수준에 해당하는 표본 통계량 Z값을 결정

e.g. 신뢰수준 95%에 해당하는 Z값은 +-1.96

 

 4. 모집단의 평균을 μ, 표본의 평균을 x바, 모집단의 표준편차를 σ, 표본평균의 표준오차를 SE라고 하면 Pr(x바-1.96SE<μ<x바+1.96SE)=95% 관계가 성립

 

*SE는 표본평균을 중심으로 표본값들이 분산되어있는 정도를 의미

 

 5. 신뢰수준과 오차범위를 충족시켜주기 위한 표본크기는 n = Z^2/E^2*σ^2

 

*모집단의 표준편차는 추정치를 대신 이용

 

 

 

 

반응형