데이터 시각화(13)
-
분산형 차트
분산형 차트는 행·열 선반에 각각 1개 이상의 측정값을 활용하여 해당 데이터가 어떻게 분포되어 있는지 파악할 수 있는 파트입니다. 여러 마크 유형을 활용할 수 있는데, 색상과 크기를 활용하여 데이터의 측정 가능한 세부 정보 또한 추가로 표현할 수 있습니다. 데이터의 분포 위치를 표현하거나 데이터 간 상관관계를 파악할 때, 유용한 차트로 수익성과 매출이 높은 회원을 동시에 파악할 때 유용하며, 또한 수익률 또는 반품률과 같이 대비되는 데이터를 동시에 파악해 영업 사원의 정확한 실적을 파악하는 경우에도 활용됩니다. 상관관계를 표현하는 경우, 개인의 소득 수준과 비만율의 관계를 표현할 수 있으며, 부모의 신체 키와 자녀의 신체 키 사이의 관계를 표현할 수 있습니다. 분산형 차트는 두 데이터의 상관관계를 시각적..
2023.04.14 -
영역 차트
영역 차트는 시계열에 따른 누적 데이터가 어떻게 구성되고 있는지 보여 줄 때 효과적으로 활용할 수 있는 차트입니다. 시간의 추이에 따라 어느 제품군에서 가장 큰 매출 비중을 차지하는지 확인할 수 있고, 고객을 분석할 때 성별, 연령별, 지역별로 어느 항목에서 비중이 증감했는지 확인할 수 있습니다. 사이드 바에서 Ctrl(window 체제) 혹은 command(mac 체제)을 이용하여 [대분류], [주문 날짜], [매출] 필드를 다중 선택한 후 오른쪽 위의 [표현 방식]에서 [영역 차트]를 선택합니다. 그리고 사이드 바에 있는 [대분류] 필드를 [마크] 카드 위의 [레이블]로 드래그합니다. 열 선반의 [년(주문 날짜)] 필드 앞에 있는 '+'를 클릭하면 주문 날짜의 기준이 '분기'로 변경됩니다. 좀 더 깔..
2023.04.09 -
[3주차 - Day5] Python으로 시각화 프로젝트
* 데이터 출처: https://www.kaggle.com/shivamb/netflix-shows import pandas as pd import os # os.environ을 이용하여 Kaggle API Username, Key 세팅하기 os.environ['KAGGLE_USERNAME'] = 'jhighllight' os.environ['KAGGLE_KEY'] = 'xxxxxxxxxxxxxxxxxxxxxxxxxxx' # Linux 명령어로 Kaggle API를 이용하여 데이터셋 다운로드하기 (!kaggle ~) # Linux 명령어로 압축 해제하기 !kaggle datasets download -d shivamb/netflix-shows !unzip '*.zip' netflix-shows.zip: S..
2023.04.01 -
워드 클라우드
워드 클라우드는 텍스트 형식의 데이터를 시각화하거나 분석할 때 사용. 차원을 텍스트로 표현하며 측정값을 통해 텍스트의 크기 또는 색상으로 수치를 표현하여 비교할 수 있습니다. 워드 클라우드를 통한 후기 분석은 비즈니스 의사결정 또는 마케팅 전략 수정의 토대가 될 수 있습니다. 댓글 혹은 게시글 분석 등에서 어떤 키워드가 많이 활용되었는지 분석할 때 사용하는데, 온라인 쇼핑 업계에서 각 구매자가 남긴 후기 데이터를 모아 워드 클라우드를 구성하여 활용하는 것이 대표적인 사례입니다. [도시] 차원 필드를 [마크] 카드 위의 [레이블], 측정값 [매출] 필드를 [마크] 카드 위의 [크기]로 각각 드래그합니다. 마크 유형의 기본 설정인 [자동]을 [텍스트]로 변경하면 다음과 같이 워드 클라우드 형태가 나타납니다...
2023.03.29 -
트리맵 차트
트리맵 차트는 하나의 차원과 측정값으로 만들 수 있는 간단한 차트입니다. 차원값에 따라 트리맵의 구조와 영역이 결정되며, 측정값의 크기에 따라 트리맵의 영역별 차이를 크기와 색상을 통해 확인할 수 있습니다. 트리맵 차트는 하나의 화면에서 여러 항목별 데이터를 표현하거나 비교할 때 효과적으로 활용할 수 있습니다. 1개 이상의 차원과 측정값이 선택된 상태라면 [표현 방식]에서 트리맵을 구현할 수 있습니다. 윈도는 Ctrl, 맥은 command를 누른 상태에서 [세그먼트]와 [매출] 필드를 선택한 후 오른쪽 위에 있는 [표현 방식]에서 트리맵 차트를 선택합니다. 윈도는 Ctrl, 맥은 command를 누른 상태에서 사이드 바에 있는 [대분류], [중분류], [제품 이름] 필드를 선택합니다. 다중 선택한 필드 ..
2023.03.28 -
Part2. Chapter 2 - 뉴욕에서 방이 둘 딸린 집을 에어비엔비에 내놓으려 한다, 이 때 적당한 숙바..
데이터 출처: https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data New York City Airbnb Open Data Airbnb listings and metrics in NYC, NY, USA (2019) www.kaggle.com Step 1. 데이터셋 준비하기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns Colab Notebook에 Kaggle API 세팅하기 import os # os.environ을 이용하여 Kaggle API Username, Key 세팅하기 os.environ['KAGGLE_USERNAME'..
2023.03.27