[GUI] 10주차, 가설과 가설 검증

2022. 6. 20. 10:302022/GUI

반응형

서울여대 김예리 교수님의 'GUI를 활용한 데이터사이언스' 수업을 듣고 작성한 복습용 글입니다.

교재: 마케팅조사원론


가설의 의미와 종류

  • 가설의 통계적 검증 필요성
    • 통계적 검증이 부재한 가설 기반 의사결정 → 실패확률이 높으며 기업 경영성과에 부정적 결과 초래
    • 가설적 주장 관련 자료수집, 통계적 검증 후 최종 의사결정을 하는 경우 실패확률 낮아짐
    • 가설: 어떤 현상에 대한 연구자의 추측의 서술로 증명되지 않은 연구자의 주장을 문장으로 표현한 것

    귀무가설 대립가설
    조사자의 주장인 대립가설과 반대되는 진술 조사자가 제기하는 주장
    조사자가 부정하고 싶은 가설 수집자료에 의해 사실로 입증되기 원하는 진술
    • 조사자의 주장을 세우고 반대 주장을 귀무가설로 설정, 귀무가설이 참이라고 가정 후 귀무가설이 참이 아님을 입증함 → 잘못된 의사결정으로 인해 발생할 수 있는 위험을 줄이기 위해서
    • 단일모집단 평균에 대한 가설검증 절차
      • 가설 설정
      • 검증통계량 및 가설 채택 기준 결정
        • 표본의 크기에 따라 달라짐
        • 표본의 크기가 크거나 모집단의 분산을 아는 경우 z통계량을 사용
        • 표본의 크기가 크면(30명 이상), Z통계량의 표본분포는 정규분포를 따름
        • 모집단의 표준편차를 모르더라도 중심극한정리에 따라 조사자는 모집단의 표준편차의 근사치로 표본표준편차를 이용할 수 있음
        • 모집단의 분산을 모르거나 표본 크기가 작을 경우, t통계량 이용
      • 가설 채택여부 결정을 위한 기준결정가설 채택 여부 결정
        • 유의수준 5%일 때 임계치 1.645
    • 단일 모집단 비율 검증
      • 가설 설정
      • 검증통계량 및 가설 채택 기준 결정
        • 모집단 가설검증시 정규분포를 따르는 Z통계량 이용
        • 모집단의 분산을 알거나 표본의 크기가 클 경우 검증통계량 Z통계량 이용
      • 가설 채택여부 결정을 위한 기준결정가설 채택 여부 결정
        • 유의수준 5%일 때 임계치 1.645

통계기법 분류 기준

  • 변수의 수
    • 단일변량 통계분석: 한개의 변수 분석
      • 한 변수의 분포상 특성 파악시 사용
      • 기술통계량
        • 대푯값: 어떤 질문에 대한 가장 일반적인 응답자의 반응, 평균, 최빈수, 중위수 등
        • 변이: 수집자료가 평균을 중심으로 슽어져있는 정도, 분산, 표준편차 등
          • 분산: 평균을 중심으로 측정값들이 흩어져있는 정도, 등간척도 이상의 척도로 수집된 자료의 변이 측정 → 평균이 같더라도 분산이 다르면 다른 결론이 유도됨
    • 다변량 통계분석: 2개 또는 그 이상 변수 사이의 관계 파악
      • 2개 또는 그 이상의 변수들 사이의 관계 파악
      • 이원변량분석: 2개 변수 분석
      • 다변량분석: 3개 이상의 변수 분석
      • 종속관계 분석분석방법 독립변수 종속변수
        카이제곱분석 명목척도(비계량) 빈도수(비계량)
        t검증 명목척도(비계량) 등간척도, 비율척도(계량)
        분산분석 명목척도(비계량) 등간척도, 비율척도(계량)
        판별분석 등간척도, 비율척도(계량) 명목척도(비계량)
        로짓분석 등간척도, 비율척도(계량) 명목척도(비계량)
        회귀분석 등간척도, 비율척도(계량) 등간척도, 비율척도(계량)
  • 상호의존관계 분석
    • 요인분석: 다수 변수들 간 상관관계를 분석하여 여러 변수들을 공통 설명하는 소수의 요인으로 줄이는 통계방법 → 분석에 용이한 적은수의 새로운 변수 도출 가능
    • 군집분석: 다수 대상들이 공유하는 속성을 토대로 유사한 특성을 가진 대상끼리 하나의 집단으로 묶는데 사용되는 통계기법, 니즈가 비슷한 소비자 집단을 그룹핑하는 시장세분화에 활용
  • 척도의 종류
    • 모수통계분석: 등간척도, 비율척도 이용
    • 비모수통계분석: 명목척도, 서열척도 이용
반응형