[데이터 시각화] 시각화 기본 2 (재정리)

2022. 12. 22. 09:182022/데이터시각화

서울여대 데이터사이언스학과 김예리 교수님 '데이터 시각화' 수업을 듣고 정리한 내용입니다.


😮 Story Telling

  • 스토리 3단 구성
    • 컨텍스트 설명
      • 누구에게 전달하는지 잘 생각해야 함
      • 내부 이해 관계자에게 하는가?
        • employees, manager, owners
      • 외부 이해관계자에게 하는가?
        • suppliers, society, government, creditors, shareholders, customers
    • 핵심 메세지 : 문제와 기회를 이야기함
    • 결론 → 이유, 예시 → Recommended Action
      • key performance index의 변화가 어떤지를 설명
        • money의 revenue 변화, costs 변화 설명
        • market의 market share 변화, time to market 변화 설명
        • expsure의 retention 변화, risk 변화 설명
  • 득과 실을 따짐 : 예상 변화 수치, 시간과 비교

💻 태블로를 사용하는 이유

  • 빠른 drag n drop을 이용해 필터링, 색상마크 카드 등 다양한 시각적 속성을 활용해 빠르게 데이터를 이해하고 분석하고 시각화할 수 있음
  • 가설 수립 전 EDA에 최적화
  • 사용자와 인터랙션 가능
  • tableau public, makeovermonday, tableautiptuesday 등 커뮤니티 존재

➕ 태블로 Product Eco system

  • 데이터 전처리
    • Tableau Prep
  • 데이터 시각화, 분석
    • Tableau Desktop
  • 파일 읽기
    • Tableau Reader
      • 데이터 공유
  • 파일 업로드
    • Tableau Server
      • 데이터 공유 (+ Tableau mobile, Tableau API)
    • Tableau Online
    • Tableau Public
  • 데이터 저장 (태블로 자체 엔진)
    • TDS
    • TDE/HYPER

🟰 데이터 연결

  • 파일 데이터 종류
    • excel, csv, txt, json, pdf, shp, sas, spss, r, 저장된 데이터 원본, hyper, tde
  • 데이터 연결 패널
    • 왼쪽 패널
      • 연결된 데이터 원본과 해당 데이터 원본 내 시트 리스트들이 표시됨
    • 캔버스
      • 데이터 원본의 결합 현황을 보여줌
    • 데이터 그리드
      • 데이터 원본의 결합 현황을 보여줌
    • 메타데이터 그리드
      • 데이터 원본의 필드가 행으로 요약되어 표시되는 곳으로, 태블로 데이터 원본의 구조를 빠르게 파악할 수 있음서버
  • 서버 데이터 연결
    • 실시간 대시보드를 만들거나 데이터 업데이트와 스키마 변경이 빈번할 때
    • 보안이 중요한 데이터를 이용할 때
    • 서버 데이터 종류
      • tableau server, mysql, google bigquery, google spreadsheet, salesforce, amazon redshift, cloudera hadoop
  • 데이터 관계 및 관계 편집
    • 데이터 관계
      • 데이터 분석을 위해 여러 테이블에서 데이터를 결합하는 방법
      • 조인과 달리 테이블로 병합되지않고 각 테이블을 유지하기 때문에 집계값이 중복되지 않음
      • inner, left, right, full outer 네종류의 병합 방식이 있음
    • 조인 유형의 경우 선택할 필요 없음
      • 분석 중 사용되는 필드를 기반으로 적절한 조인을 자동으로 만듬
    • 데이터 원본 새로고침
      • 데이터 라이브 연결
        • 데이터베이스에 쿼리를 보내고 결과에 따라 뷰 업데이트
      • 추출
        • 성능을 향상시키기 위해 데이터를 로컬로 저장 (오프라인)
    • 데이터 원본 보기
      • 데이터 원본 탭 우클릭
      • 상단의 데이터 탭 > 연결되어있는 데이터 > 데이터 보기
      • 데이터 패널의 짝대기 3개
    • 데이터 수정하기
      • 계산된 필드 만들기
        • 선택한 필드로 새 필드를 만들 수 있음
      • 그룹만들기
        • 서로 다른 차원 멤버들을 그룹지어 줌 (퀵 데이터 정리)
      • 분할
        • 태블로가 알아서 적절하게 분할해 여러개 열로 나누어줌
      • 피벗
        • 가로로 길게 늘어진 열을 세로로 만들어줌(한 원본에 피벗 한번 가능)
      • 설명
        • 필드에 대한 추가적인 정보