[데이터 시각화] 시각화 기본 2 (재정리)
2022. 12. 22. 09:18ㆍ2022/데이터시각화
반응형
서울여대 데이터사이언스학과 김예리 교수님 '데이터 시각화' 수업을 듣고 정리한 내용입니다.
😮 Story Telling
- 스토리 3단 구성
- 컨텍스트 설명
- 누구에게 전달하는지 잘 생각해야 함
- 내부 이해 관계자에게 하는가?
- employees, manager, owners
- 외부 이해관계자에게 하는가?
- suppliers, society, government, creditors, shareholders, customers
- 핵심 메세지 : 문제와 기회를 이야기함
- 결론 → 이유, 예시 → Recommended Action
- key performance index의 변화가 어떤지를 설명
- money의 revenue 변화, costs 변화 설명
- market의 market share 변화, time to market 변화 설명
- expsure의 retention 변화, risk 변화 설명
- key performance index의 변화가 어떤지를 설명
- 컨텍스트 설명
- 득과 실을 따짐 : 예상 변화 수치, 시간과 비교
💻 태블로를 사용하는 이유
- 빠른 drag n drop을 이용해 필터링, 색상마크 카드 등 다양한 시각적 속성을 활용해 빠르게 데이터를 이해하고 분석하고 시각화할 수 있음
- 가설 수립 전 EDA에 최적화
- 사용자와 인터랙션 가능
- tableau public, makeovermonday, tableautiptuesday 등 커뮤니티 존재
➕ 태블로 Product Eco system
- 데이터 전처리
- Tableau Prep
- 데이터 시각화, 분석
- Tableau Desktop
- 파일 읽기
- Tableau Reader
- 데이터 공유
- Tableau Reader
- 파일 업로드
- Tableau Server
- 데이터 공유 (+ Tableau mobile, Tableau API)
- Tableau Online
- Tableau Public
- Tableau Server
- 데이터 저장 (태블로 자체 엔진)
- TDS
- TDE/HYPER
🟰 데이터 연결
- 파일 데이터 종류
- excel, csv, txt, json, pdf, shp, sas, spss, r, 저장된 데이터 원본, hyper, tde
- 데이터 연결 패널
- 왼쪽 패널
- 연결된 데이터 원본과 해당 데이터 원본 내 시트 리스트들이 표시됨
- 캔버스
- 데이터 원본의 결합 현황을 보여줌
- 데이터 그리드
- 데이터 원본의 결합 현황을 보여줌
- 메타데이터 그리드
- 데이터 원본의 필드가 행으로 요약되어 표시되는 곳으로, 태블로 데이터 원본의 구조를 빠르게 파악할 수 있음서버
- 왼쪽 패널
- 서버 데이터 연결
- 실시간 대시보드를 만들거나 데이터 업데이트와 스키마 변경이 빈번할 때
- 보안이 중요한 데이터를 이용할 때
- 서버 데이터 종류
- tableau server, mysql, google bigquery, google spreadsheet, salesforce, amazon redshift, cloudera hadoop
- 데이터 관계 및 관계 편집
- 데이터 관계
- 데이터 분석을 위해 여러 테이블에서 데이터를 결합하는 방법
- 조인과 달리 테이블로 병합되지않고 각 테이블을 유지하기 때문에 집계값이 중복되지 않음
- inner, left, right, full outer 네종류의 병합 방식이 있음
- 조인 유형의 경우 선택할 필요 없음
- 분석 중 사용되는 필드를 기반으로 적절한 조인을 자동으로 만듬
- 데이터 원본 새로고침
- 데이터 라이브 연결
- 데이터베이스에 쿼리를 보내고 결과에 따라 뷰 업데이트
- 추출
- 성능을 향상시키기 위해 데이터를 로컬로 저장 (오프라인)
- 데이터 라이브 연결
- 데이터 원본 보기
- 데이터 원본 탭 우클릭
- 상단의 데이터 탭 > 연결되어있는 데이터 > 데이터 보기
- 데이터 패널의 짝대기 3개
- 데이터 수정하기
- 계산된 필드 만들기
- 선택한 필드로 새 필드를 만들 수 있음
- 그룹만들기
- 서로 다른 차원 멤버들을 그룹지어 줌 (퀵 데이터 정리)
- 분할
- 태블로가 알아서 적절하게 분할해 여러개 열로 나누어줌
- 피벗
- 가로로 길게 늘어진 열을 세로로 만들어줌(한 원본에 피벗 한번 가능)
- 설명
- 필드에 대한 추가적인 정보
- 계산된 필드 만들기
- 데이터 관계
반응형
'2022 > 데이터시각화' 카테고리의 다른 글
[데이터 시각화] 시각화 기본 4 (재정리) (0) | 2022.12.22 |
---|---|
[데이터 시각화] 시각화 기본 3 (재정리) (0) | 2022.12.22 |
[데이터 시각화] 시각화 기본 1 (재정리) (0) | 2022.12.22 |
[데이터 시각화] 태블로 기본 2 (0) | 2022.10.24 |
[데이터 시각화] 태블로 개념 1 (0) | 2022.10.24 |