[error] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb1 in position 0: invalid start byte

2024. 8. 10. 20:29개인활동/기타

csv 파일을 불러올 때 간혹가다 인코딩이 제대로 안되는 경우들이 존재한다.

 

이렇게 지저분하게 문자들이 존재할 때, read_csv를 이용해 파일을 불러오면 utf-8로 안된다는 에러가 뜬다.

 

이 문제를 해결 하는 방법, 굉장히 간단했다.

 

인코딩 형식을 바꿔주면 됨.

 

data = pd.read_csv("자치구별_점포수.csv", encoding="cp949")
data

 

다음과 같이 "cp949"를 이용해주면 데이터가 깔끔하게 잘 출력되는 것을 확인할 수 있다.