분산분석(ANOVA) 해석하기

2024. 6. 12. 02:032024/기초통계학

반응형

I. 분산분석(ANOVA)란?

  • 세개 이상의 모집단의 평균을 비교하는 과정에서 분산을 사용하는 통계적 기법
  • 피셔가 처음으로 도입한 통계적 방법론
  • 실험 계획법에서 널리 응용되는 방식으로 실험 내에서 관측값에 영향을 주는 요인이 한개인 경우 일원분산분석법 혹은 일원배치법
  • 실험 시 요인에 여러 조건을 주는 것을 요인수준 또는 인자수준
  • 각 그룹간의 분산은 커야하며 그룹 내의 분산은 작아야 함

II. 분산분석 결과 해석하기

1. 일원배치 분산분석

1) 기업의 크기와 생산비용 (유의수준 0.05)

  • 귀무가설 : 기업의 크기에 따라 생산비용의 평균은 모두 같다.
  • 대립가설 : 기업의 크기에 따라 생산비용의 평균이 모두 같은 것은 아니다.

유의확률 0.000으로 유의수준 0.05보다 작기에 귀무가설을 기각하고 대립가설을 채택한다. 따라서 기업의 크기에 따라 생산비용의 평균이 모두 같은 것은 아니다. 그렇다면 어떤 집단간의 차이가 존재하는 것인가? 이에 대한 사후분석을 진행한다.

 

💡Point : 귀무가설이 채택되는 경우 사후분석은 필요없음

사후분석 결과 소기업과 중기업, 중기업과 대기업간의 차이가 존재한다. 소기업과 대기업은 같은 1집합에 포함되며 중기업은 다른 2집합에 포함된다. 따라서 소기업과 중기업, 중기업과 대기업간에는 차이가 존재한다.

 

2) 지역과 박테리아 (유의수준 0.05)

  • 귀무가설 : 각 지역 별 박테리아의 평균 수는 동일하다.
  • 대립가설 : 모든 지역에서 박테리아의 평균 수가 동일한 것은 아니다.

분산분석 결과 유의확률 0.011로 유의수준 0.05보다 작기에 귀무가설을 기각하고 대립가설을 채택한다. 따라서 모든 지역에서 박테리아의 평균 수가 동일한 것은 아니다. 그렇다면 어떤 지역에서 차이가 존재하는 것인가? 사후분석을 진행한다.

사후분석 결과 I지역과 II지역, II지역과 IV지역간의 차이가 존재한다. 동질적 부분집합을 확인했을 때 II지역과 IV 지역간의 차이는 명확하게 존재하는 것을 확인할 수 있다.

 

3) 교육프로그램과 판매실적 (유의수준 0.05)

  • 귀무가설 : 교육프로그램에 따라 판매실적이 모두 같다.
  • 대립가설 : 교육프로그램에 따라 판매 실적이 모두 같은 것은 아니다.

분석 결과 유의확률을 확인하였을 때 0.028로 유의수준 0.05보다 작기에 귀무가설을 기각하고 대립가설을 채택한다. 따라서 교육 프로그램에 따라 판매 실적이 모두 같은 것은 아니다. 그렇다면 어떤 교육프로그램에 차기가 있는가?

사후분석 결과 C, D 프로그램간에 차이가 존재한다. 이에대한 동질적 부분집합을 확인했을 때 C, D간의 차이가 존재하는 것을 확인할 수 있다.

 

4) 소결온도와 합금밀도 (유의수준 0.05)

  • 귀무가설 : 소결온도에 따라 합금의 밀도에는 차이가 없다.
  • 대립가설 : 소결온도에 따라 합금의 밀도에는 차이가 존재한다.

분석 결과 유의확률을 확인했을 때 0.002로 유의수준 0.05보다 작기에 귀무가설을 기각하고 대립가설을 채택한다. 따라서 소결온도에 따라 합금의 밀도에는 차이가 존재한다. 그렇다면 어떤 부분에서 차이가 존재하는가?

사후 분석 결과 740도와 760도 사이에 차이가 존재하며 740도와 770도 또한 차이가 존재한다. 추가적으로 750도와 770도 사이에도 차이가 존재하며 동질적 부분집합 관계를 확인하였을 때 770도, 740도 간에는 명확한 차이가 존재한다.
반응형

'2024 > 기초통계학' 카테고리의 다른 글

회귀분석 해석하기  (0) 2024.06.12
범주형 자료 분석 및 해석하기  (0) 2024.06.12
T검정 해석하기  (0) 2024.06.11