본문 바로가기
반응형

상관관계2

[6주차 - Day3] ML_basics - E2E End-to-End 머신러닝 프로젝트 부동산 회사에 막 고용된 데이터 과학자라고 가정하고 예제 프로젝트를 처음부터 끝까지 (End-to-End) 진행했습니다. 주요 단계는 다음과 같습니다. 프로젝트 과정 1. 큰 그림을 봅니다 (look at the big picture). 2. 데이터를 구합니다 (get the data). 3. 데이터로부터 통찰을 얻기 위해 탐색하고 시각화합니다 (discover and visualize the data to gain insights). 4. 머신러닝 알고리즘을 위해 데이터를 준비합니다 (prepare the data for Machine Learning algorithms). 5. 모델을 선택하고 훈련시킵니다 (select a model and train it). 6.. 2023. 5. 14.
분산형 차트 분산형 차트는 행·열 선반에 각각 1개 이상의 측정값을 활용하여 해당 데이터가 어떻게 분포되어 있는지 파악할 수 있는 파트입니다. 여러 마크 유형을 활용할 수 있는데, 색상과 크기를 활용하여 데이터의 측정 가능한 세부 정보 또한 추가로 표현할 수 있습니다. 데이터의 분포 위치를 표현하거나 데이터 간 상관관계를 파악할 때, 유용한 차트로 수익성과 매출이 높은 회원을 동시에 파악할 때 유용하며, 또한 수익률 또는 반품률과 같이 대비되는 데이터를 동시에 파악해 영업 사원의 정확한 실적을 파악하는 경우에도 활용됩니다. 상관관계를 표현하는 경우, 개인의 소득 수준과 비만율의 관계를 표현할 수 있으며, 부모의 신체 키와 자녀의 신체 키 사이의 관계를 표현할 수 있습니다. 분산형 차트는 두 데이터의 상관관계를 시각적.. 2023. 4. 14.
반응형