[중간과제] 회귀분석 이해하기
2023. 4. 13. 20:52ㆍ2023/ML기반데이터분석
반응형
과제 회고
- 교수님의 피드백
- 데이터를 탐색하는 과정 속에서 문제 정의를 하는 것은 좋았음
- 문제정의가 덜 명확
- 상관관계만 확인하고 변수를 정한 것은 이상함
- 회귀는 인과관계를 확인하는 과정임
- 상관관계만 확인하고 마쳤다면 잘한 과제였음
- 다중공선성이 이상했던 이유는?
- 나의 평가
- 나는 회귀를 이해한듯 했으나 이해하지 못한 부분이 많았음
- 상관관계 파악과 다중공선성 확인 과정이 왜 필요한건지 파악을 못한 것 같음
- 회귀는 인과관계를 보는 것이다!!!!!! 매우 중요!!!!!!!!!!!
- 이 부분에서 이상치를 어떻게 처리할지 더 깊이 생각해봤으면 좋았을텐데...
- 통계 너무 어렵다
- 발표 전 다른 사람들의 발표를 들으며 이것저것 추가하다가 내가 꼭 말해야 할 것들을 너무 많이 빼버림
- 발표를 들으며 얻었던 지식들
- 결측치의 영향으로 인해 오차가 크게 나타나는 경우 존재
- 이때는 결측치를 제거하던가 결측치도 중요하다면 결측치와 결측치가 아닌 값들을 나눠서 분석하면 됨
- 랜덤포레스트 회귀
- 명목형 변수들을 분류 후 분류된 나머지 변수들로 회귀분석을 진행함
- 신기하다
- 결측치의 영향으로 인해 오차가 크게 나타나는 경우 존재
반응형
'2023 > ML기반데이터분석' 카테고리의 다른 글
[기말플젝] pykospacing 설치 에러 (0) | 2023.06.09 |
---|