[데이터 시각화] 시각화 기본 5 (재정리)

2022. 12. 22. 09:352022/데이터시각화

반응형

서울여대 데이터사이언스학과 김예리 교수님의 '데이터 시각화' 수업을 듣고 정리한 내용입니다.


🔨 데이터 Shaping

  • wide form → long form
    • 데이터 해석기
      • 데이터 전처리 시 사용됨
      • 제목, 빈 셀 인식 후 태블로에 적합한 데이터로 바꿔줌
      • 엑셀, 구글시트, 텍스트파일, pdf에 적용가능
      • 병합된 셀 해결, 제목 해결, 데이터 해석 결과 확인 가능
      • 공공데이터 포털에서 데이터를 수집하는 경우 매우 유용하게 사용할 수 있음
      • 이미 태블로가 제대로 인색할 수 있는 데이터 포맷이년 사용 불가
      • 2000 column 이상인 경우 사용 불가
      • 3000*150 이상인 경우 사용 불가
    • 피벗
      • 원하는 열들을 모두 선택하여 우클릭 후 피벗 클릭
      • 가로로 긴 데이터를 세로로 바꿔줌
  • EDA
    • 데이터 살펴보기
    • 필드 설명 보기
    • 차원과 측정값 분류
      • 사칙연산이 가능하다면 측정값
    • 기본 속성 조정하기
      • 원하는 값 우클릭 > 기본속성에서 수정하고자 하는 것을 선택
    • 레코드 수 확인하기
  • 데이터 전처리
    • 데이터 타입 수정
      • 문자로 인식된 주소 데이터를 지리적 위치로 수정
    • 필드명 수정
      • 이름을 더블클릭하면 수정할 수 있음
    • 새로운 계산된 필드 생성
    • 피벗
    • 스플릿
      • 원하는 데이터 column 우클릭 후 분리, 원하는 구분자(띄어쓰기, 콤마 등)를 기준으로 분리해줌
    • 데이터 정렬

🇪🇺 데이터 관계

  • 두 테이블 간의 관계를 설정하지만 하나의 테이블이 되지는 않음
  • 조인 유형을 선택할 필요 없이 자동으로 적절한 조인을 만들어줌
  • 모든 행 및 열데이터를 사용할 수 있음
  • 집계값이 중복되지 않음
  • 데이터 관계 만들기
    • 테이블을 캔버스로 끌어옴
    • 다른 테이블도 캔버스로 끌어옴
    • 관계 정의(필드 추가도 가능)
    • 관계 위치 변경
      • 화살표 클릭 후 이동할 위치 선택
    • 관계 필드 편집
      • 관계 라인 클릭 후 변경
  • 데이터 유니온 시 주의점
    • 같은 데이터 타입끼리만 연결 가능
      • excel과 google sheet는 연결 불가
    • 모든 테이블에서 필드명과 데이터 타입이 같아야 함
  • 데이터 유니온
    • 새로운 유니온 생성 > 캔버스로 드래그 > 유니온 팝업창 생성
    • 유니온 팝업창에서 유니온 할 테이블을 각각 드래그
반응형