[데이터 시각화] 시각화 기본 3 (재정리)

2022. 12. 22. 09:302022/데이터시각화

서울여대 데이터사이언스학과 김예리 교수님의 '데이터 시각화' 수업을 듣고 정리한 내용입니다.


📊 차원과 측정값

차원 측정값
- 나눠서 볼 기준이자 숫자를 자르는 기준임
- 범주형 데이터
- 차원을 통해 측정값을 나눠줄 수 있음
- 차원값과 측정값은 함께 해야 의미 있음
- 숫자
- 수치형 데이터
- 측정값 그 자체는 인사이트가 없음
- 측정값은 기본적으로 집계를 함 (합계, 평균 등)
지역, 연도, 성별 등 매출, 수익, 배송비
  • 태블로는 기본적으로 측정값을 집계함 → 숫자 데이터이기 때문
    • 차원이 존재하지 않으면 하나의 덩어리로 보여줌
    • 합계를 낼 수 있다면 측정값, 합계를 낼 수 없다면 차원
  • 페이지, 색상, 크기, 텍스트, 세부정보, 행, 열, 워크시트에 차원을 추가하면 뷰의 세부 수준이 영향을 받음

📈 연속형과 불연속형

연속형 불연속형
초록색 파란색
연속적 순서가 있는 이어진 데이터 개별적으로 구분되는 데이터
오름차순, 내림차순 정렬 불가 오름차순, 내림차순 정렬 가능
색상마크에 올려놓으면 그라데이션이 나타남 색상마크에 올려놓으면 각각 유니크한 색상이 맵핑됨
필터링을 하는 경우 범위를 정해줄 수 있음 필터링을 하는 경우 체크박스로 카테고리를 선정해야 함

➕ 태블로의 집계 방식

Row-level Aggregate level
데이터 셋의 행 단위로부터 계산 현재 뷰의 세부 수준에 따라 계산
현재 뷰와 상관없이 가장 세부적인 수준에서 계산 현재 보여지는 뷰의 수준에 맞게 계산
뷰에 드래그하는 경우 집계됨 뷰에 드래그하는 경우 집계되지 않음

✅ 마크타입, 마크카드

  • 색상, 크기, 레이블, 세부정보, 도구 설명으로 데이터에 컨텍스트 추가
    • 태블로가 자동적으로 마크타입을 설정해주기도 함
    • 잘못된 마크타입 선택을 태블로가 막지 않기도 함
      • 라인 그래프는 시간에 따른 흐름을 나타낼 때 쓰이는데 지역별 매출 비교에 라인그래프를 쓰는 경우
    • 마크카드에는 색상, 크기, 레이블, 세부정보, 도구설명이 있음
      • 마크카드를 너무 많이 사용하는 경우 인지 고부하가 옴
        • 색상을 너무 많이 부여하는 경우
      • 도구 설명을 이용하면 보여지는 데이터가 무엇인지 자세하게 보여줄 수 있음

🌳 시트 서식 변경

  • 타이틀을 더블클릭하면 시트의 제목을 바꿀 수 있음
  • 마크카드의 텍스트 > …을 클릭하면 워크시트에 보여지는 텍스트 서식을 변경할 수 있음
  • 머리글의 경우 머리글을 우클릭하면 서식 변경 패널일 뜨고 이를 이용해 서식을 수정할 수 있음
  • 통합 문서 서식
    • 워크시트 서식
    • 행렬 서식
    • 특정 필드 서식
    • 필드 레이블 서식
    • 도구 설명, 제목, 마크