[중간과제] 회귀분석 이해하기

2023. 4. 13. 20:522023/ML기반데이터분석

반응형

https://github.com/cAhyoung/ml_based_data_analytics/blob/main/mid_assignment/regression_with_airquality.ipynb

 

GitHub - cAhyoung/ml_based_data_analytics

Contribute to cAhyoung/ml_based_data_analytics development by creating an account on GitHub.

github.com

과제 회고

  • 교수님의 피드백
    • 데이터를 탐색하는 과정 속에서 문제 정의를 하는 것은 좋았음
    • 문제정의가 덜 명확
    • 상관관계만 확인하고 변수를 정한 것은 이상함
    • 회귀는 인과관계를 확인하는 과정임
    • 상관관계만 확인하고 마쳤다면 잘한 과제였음
    • 다중공선성이 이상했던 이유는?
  • 나의 평가
    • 나는 회귀를 이해한듯 했으나 이해하지 못한 부분이 많았음
    • 상관관계 파악과 다중공선성 확인 과정이 왜 필요한건지 파악을 못한 것 같음
    • 회귀는 인과관계를 보는 것이다!!!!!! 매우 중요!!!!!!!!!!!
    • 이 부분에서 이상치를 어떻게 처리할지 더 깊이 생각해봤으면 좋았을텐데...
    • 통계 너무 어렵다
    • 발표 전 다른 사람들의 발표를 들으며 이것저것 추가하다가 내가 꼭 말해야 할 것들을 너무 많이 빼버림
  • 발표를 들으며 얻었던 지식들
    • 결측치의 영향으로 인해 오차가 크게 나타나는 경우 존재
      • 이때는 결측치를 제거하던가 결측치도 중요하다면 결측치와 결측치가 아닌 값들을 나눠서 분석하면 됨
    • 랜덤포레스트 회귀
      • 명목형 변수들을 분류 후 분류된 나머지 변수들로 회귀분석을 진행함
      • 신기하다
반응형

'2023 > ML기반데이터분석' 카테고리의 다른 글

[기말플젝] pykospacing 설치 에러  (0) 2023.06.09