[데이터 시각화] 시각화 기본 3 (재정리)
2022. 12. 22. 09:30ㆍ2022/데이터시각화
반응형
서울여대 데이터사이언스학과 김예리 교수님의 '데이터 시각화' 수업을 듣고 정리한 내용입니다.
📊 차원과 측정값
차원 | 측정값 |
- 나눠서 볼 기준이자 숫자를 자르는 기준임 - 범주형 데이터 - 차원을 통해 측정값을 나눠줄 수 있음 - 차원값과 측정값은 함께 해야 의미 있음 |
- 숫자 - 수치형 데이터 - 측정값 그 자체는 인사이트가 없음 - 측정값은 기본적으로 집계를 함 (합계, 평균 등) |
지역, 연도, 성별 등 | 매출, 수익, 배송비 |
- 태블로는 기본적으로 측정값을 집계함 → 숫자 데이터이기 때문
- 차원이 존재하지 않으면 하나의 덩어리로 보여줌
- 합계를 낼 수 있다면 측정값, 합계를 낼 수 없다면 차원
- 페이지, 색상, 크기, 텍스트, 세부정보, 행, 열, 워크시트에 차원을 추가하면 뷰의 세부 수준이 영향을 받음
📈 연속형과 불연속형
연속형 | 불연속형 |
초록색 | 파란색 |
연속적 순서가 있는 이어진 데이터 | 개별적으로 구분되는 데이터 |
오름차순, 내림차순 정렬 불가 | 오름차순, 내림차순 정렬 가능 |
색상마크에 올려놓으면 그라데이션이 나타남 | 색상마크에 올려놓으면 각각 유니크한 색상이 맵핑됨 |
필터링을 하는 경우 범위를 정해줄 수 있음 | 필터링을 하는 경우 체크박스로 카테고리를 선정해야 함 |
➕ 태블로의 집계 방식
Row-level | Aggregate level |
데이터 셋의 행 단위로부터 계산 | 현재 뷰의 세부 수준에 따라 계산 |
현재 뷰와 상관없이 가장 세부적인 수준에서 계산 | 현재 보여지는 뷰의 수준에 맞게 계산 |
뷰에 드래그하는 경우 집계됨 | 뷰에 드래그하는 경우 집계되지 않음 |
✅ 마크타입, 마크카드
- 색상, 크기, 레이블, 세부정보, 도구 설명으로 데이터에 컨텍스트 추가
- 태블로가 자동적으로 마크타입을 설정해주기도 함
- 잘못된 마크타입 선택을 태블로가 막지 않기도 함
- 라인 그래프는 시간에 따른 흐름을 나타낼 때 쓰이는데 지역별 매출 비교에 라인그래프를 쓰는 경우
- 마크카드에는 색상, 크기, 레이블, 세부정보, 도구설명이 있음
- 마크카드를 너무 많이 사용하는 경우 인지 고부하가 옴
- 색상을 너무 많이 부여하는 경우
- 도구 설명을 이용하면 보여지는 데이터가 무엇인지 자세하게 보여줄 수 있음
- 마크카드를 너무 많이 사용하는 경우 인지 고부하가 옴
🌳 시트 서식 변경
- 타이틀을 더블클릭하면 시트의 제목을 바꿀 수 있음
- 마크카드의 텍스트 > …을 클릭하면 워크시트에 보여지는 텍스트 서식을 변경할 수 있음
- 머리글의 경우 머리글을 우클릭하면 서식 변경 패널일 뜨고 이를 이용해 서식을 수정할 수 있음
- 통합 문서 서식
- 워크시트 서식
- 행렬 서식
- 특정 필드 서식
- 필드 레이블 서식
- 도구 설명, 제목, 마크
반응형
'2022 > 데이터시각화' 카테고리의 다른 글
[데이터 시각화] 시각화 기본 5 (재정리) (0) | 2022.12.22 |
---|---|
[데이터 시각화] 시각화 기본 4 (재정리) (0) | 2022.12.22 |
[데이터 시각화] 시각화 기본 2 (재정리) (1) | 2022.12.22 |
[데이터 시각화] 시각화 기본 1 (재정리) (0) | 2022.12.22 |
[데이터 시각화] 태블로 기본 2 (0) | 2022.10.24 |