2022. 5. 12. 22:22ㆍ2022/GUI
서울여대 김예리 교수님의 'GUI를 활용한 데이터사이언스' 수업을 듣고 작성한 복습용 글입니다.
교재: 마케팅조사원론
1. 표본조사와 전수조사
1) 설문지 작성 시 조사 계획을 수립해야 하는데 이때 전수조사와 표본조사 중 조사방법을 결정해야 한다. 이때 모집단의 규모와 성격, 조사예산, 표본오류와 비표본오류를 고려하여 결정해야 한다.
표본조사 | 조사방법 | 전수조사 |
모집단 내에 포함된 모든 대상을 조사하는 방식 ex) 인구주택총조사 (총조사: 모집단의 양상을 파악하여 국가정책 수립의 기초 자료로 활용) |
특징 | 표본의 특성을 기반으로 모집단의 특성을 추정하는 방식 *표집: 모집단의 일부인 표본을 추출하는 과정 |
표본오차 없음 | 장점 | 비용절감, 신속성 |
시간과 비용 많이 소요 | 단점 | 일반화 제약, 편향된 조사 가능성 존재 |
2) 오류의 종류
오류 | |||||||
표본오류 | 비표본오류 | ||||||
모집단을 대표할 표본단위들이 추출되지 못하는 경우 발생 표본의 크기가 증가할수록 표본 오류의 크기 감소 |
조사 대상자들로부터 자료수집 과정에서 발생 전수조사, 표본조사 모두 발생하며 조사 대상이 많을수록 증가 |
||||||
비관찰오류 | 관찰오류 | ||||||
불포함오류 | 무응답오류 | 조사현장에서의 오류 | 자료처리상에서의 오류 |
2. 표본추출 과정
1) 모집단 설정
-조사대상이 되는 모집단 결정.
*모집단: 조사자의 관심 대상이 되는 사람, 제품, 기업, 지역 등의 집합체로 조사자가 직접적인 방법이나 통계적 추정에 의해 정보를 얻으려는 대상 집단
e.g. 대통령 선거 유권자 조사를 실시하는 경우의 모집단
-> 투표일 현재 대한민국에 거주하는 만 19세 이상의 일반 국민
2) 표본 프레임 선정
*표본프레임: 모집단 내 조사 대상들의 명단이 수록된 목록 -> 최종적인 표본을 추출하는 목록
e.g. 행정구역 편람에 수록된 우리나라 읍면동에 대한 목록
-표본 프레임의 조건
- 모집단에 누락이 있으면 오류 발생
- 중복된 대상이 있는 경우 표본 추출 가능성이 높아져 오류 발생 -> 중복으로 포함하지 않는 것이 좋음
- 실제 접촉할 수 있는 정확한 정보가 있어야 조사에 사용 가능
- 대표성이 확보되어야 함 -> 신뢰성, 타당성 확보를 위한 조건
-표본프레임의 오류
표본프레임이 모집단 내에 포함되는 경우 | 모집단이 표본프레임 내에 포함되는 경우 | 모집단과 표본프레임의 일부만이 일치하는 경우 |
일부 모집단의 특성을 반영할 수 없는 오차 발생 | 표본프레임 내에 속해있는 구성요소 중 모집단에 속해있지 않는 부분이 표본으로 선정될 수 있기 때문에 오차 발생 | 표본의 대표성이 떨어지고 자료의 검토나 편집 과정도 어려워 가장 심각한 표본 프레임 오차 발생 |
e.g. 모집단이 대한민국 국민일 때 전화번호부를 사용하는 경우 | e.g. 모집단이 연간 3000만원 이상 카드 사용자일 때 카드 소지자 전체를 표본프레임으로 사용하는 경우 | e.g. 자동차 선호도를 조사할 때 전화번호부를 사용하는 경우 |
표본프레임은 모집단과 일치하는 것이 이상적이지만 현실적으로 모집단과 일치하는 표본프레임을 얻는 것은 불가능 표본 프레임 자체가 존재하지 않는 경우도 많음 대부분 상업적 조사에서 표본프레임이 필요없는 비확률표본추출방법을 이용 |
3) 표본추출방법 결정
확률 표본추출방법 | 방법 | 비확률 표본추출방법 |
모집단을 구성하는 대상들의 명단이 개재된 표본프레임을 이용해 표본을 추출 | 정의 | 표본프레임이 없어 모집단 내의 대상들이 선택될 확률을 사전에 모르는 상태에서 표본이 선정되는 방법 |
모집단 내의 각 대상들이 선택 될 확률을 미리알 수 있음 표본추출과정에서 발생되는 오류의 정도 또한 추정이 가능함 |
특징 | 추출된 표본이 모집단을 얼마나 잘 대표하는지, 조사 결과에서 어느정도의 오류가 발생할 것인지 제시 불가 |
본 표본조사의 결과는 모집단 내의 대상을 모두 조사했을 경우와 비교해 약 +-2% 이내의 차이가 발생할 확률이 95% 정도입니다. | 예 | |
표본의 수가 많지않고 표본 프레임 입수가 가능한 경우 | 이용 | 모집단의 규모가 큰 경우 |
*비확률 표본 추출방법
편의표본추출법 | 판단표본추출법 | 할당표본추출법 |
- 가장 간단한 형태의 표본 추출법 - 임의로 선정한 지역/시간대에 원하는 사람들을 표본으로 선택 |
- 조사 문제를 잘 알거나 모집단의 의견을 반영할 수 있을 것으로 판단되는 특정 집단을 표본으로 선택하는 방법 | - 상업적 마케팅조사에서 가장 많이 사용되는 방법 - 정해진 분류기준으로 전체 표본을 여러집단으로 구분하고 집단별로 필요한 대상을 추출하는 방법 - 사전에 모집단의 특성을 파악하여 표본할당을 기준으로 활용 |
- 특정 대학 앞에서 지나가는 대학생에게 협조를 구해 조사 - 지나가는 행인을 대상으로 의견을 물어보는 경우 |
- 일반 소비자는 이해하지 못할 수 있는 경우 관련 분야 전문가는 유경험자를 대상으로 조사 e.g. 스노우볼 표본추출법 (접촉한 대상자들에게 유사한 지식을 가진 다른 대상자를 소개받는 방식) |
- 구매고객의 연령별 비율을 고려하여 표본을 추출 |
- 비용이 저렴 - 절차가 간단 |
-적은 비용으로 의미있는 자료를 수집 | - 모집단의 대표성 확보 가능 : 집단분류기준을 잘 선정하면 모집단 대표성 확보 가능 - 모집단의 특성 반영 가능 : 각 집단 표본크기가 충분히 큰 경우 집단별 측정자료는 정규분포를 가져 모집단 특성을 반영할 수 있음 + 오류정도를 계산 가능 |
- 추출된 표본이 모집단을 대표하지 못함 - 응답을 거부하는 사람들의 특성 반영 불가 |
-모집단의 특성 대표 불가 |
*확률표본추출방법
4) 표본 크기 결정
- 표본의 크기는 조사비용, 조사 정확도와 밀접한 관련이 있음
- 표본추출 크기를 결정할 때 연구 목적과 조사 유형, 조사예산, 시간제약 등을 고려해야 함
*신뢰구간을 이용한 표본 크기 결정
: 조사자가 허용하는 자료의 오차의 범위와 신뢰수준을 결정하면 이를 근거로 표본의 크기를 결정하는 것
1. 허용할 수 있는 오차의 범위(E)를 결정
e.g. 모집단의 참값 +-5%
2. 신뢰수준 결정
e.g. 95% 또는 99% 수준에서 믿을 수 있는지 결정
3. 정규분포 하에 2에서 결정한 신뢰수준에 해당하는 표본 통계량 Z값을 결정
e.g. 신뢰수준 95%에 해당하는 Z값은 +-1.96
4. 모집단의 평균을 μ, 표본의 평균을 x바, 모집단의 표준편차를 σ, 표본평균의 표준오차를 SE라고 하면 Pr(x바-1.96SE<μ<x바+1.96SE)=95% 관계가 성립
*SE는 표본평균을 중심으로 표본값들이 분산되어있는 정도를 의미
5. 신뢰수준과 오차범위를 충족시켜주기 위한 표본크기는 n = Z^2/E^2*σ^2
*모집단의 표준편차는 추정치를 대신 이용
'2022 > GUI' 카테고리의 다른 글
[GUI] 11주차, 두 집단간 평균차이에 대한 가설 검증 및 분산분석, 카이제곱 검증 (0) | 2022.06.20 |
---|---|
[GUI] 10주차, 가설과 가설 검증 (0) | 2022.06.20 |
[GUI] 측정의 오류, 신뢰성과 타당성 (0) | 2022.04.20 |
[GUI] 측정대상과 척도 (0) | 2022.04.20 |
[GUI] 조사 유형별 마케팅 조사 기법 (0) | 2022.04.20 |