반응형 캐글7 COVID-19 data from John Hopkins University 데이터 소개 - 총 10개의 파일 중 2개의 Raw 데이터를 사용합니다. RAW_global_confirmed_cases.csv RAW_global_global_deaths.csv - 각 파일의 칼럼은 아래와 같습니다. Country/Region: 국가 Province/State: 지방/주 Lat: 지역의 위도 Long: 지역의 경도 날짜: 각 날짜의 확진자/사망자 수 - 데이터 출처: https://www.kaggle.com/antgoldbloom/covid19-data-from-john-hopkins-university import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import os.. 2023. 5. 21. [패캠] 우리나라의 행복지수는 몇 위? 아니, 행복지수가 도대체 뭔데? 데이터 소개 - 이번 주제는 World Happiness Report up to 2020을 사용합니다. - 각 파일의 칼럼은 아래와 같습니다. Country: 국가 Region: 국가의 지역 Happiness Rank: 행복지수 순위 Happiness Score: 행복지수 점수 GDP per capita: 1인당 GDP Healthy Life Expectancy: 건강 기대수명 Social support: 사회적 지원 Freedom to make life choices: 삶에 대한 선택의 자유 Generosity: 관용 Corruption Perception: 부정부패 Dystopia + Residual: 그 외 데이터 출처: https://www.kaggle.com/mathurinache/world-h.. 2023. 5. 17. Part2. Chapter 1 - 자동으로 모은 데이터는 분석하기 어렵다면서? 자동으로 모은 중고 자동차 데ᄋ.. 데이터 출처: https://www.kaggle.com/austinreese/craigslist-carstrucks-data Used Cars Dataset Vehicles listings from Craigslist.org www.kaggle.com Step 1. 데이터셋 준비하기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns Colab Notebook에 Kaggle API 세팅하기 import os # os.environ을 이용하여 Kaggle API Username, Key 세팅하기 os.environ['KAGGLE_USERNAME'] = 'jhighllight' os.enviro.. 2023. 3. 26. Part1. Chapter 03 - 롤(LOL) 좀 하니_ 이것만 하면 무조건 이긴다! Step 1. 데이터셋 준비하기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns Colab Notebook에 Kaggle API 세팅하기 import os # os.environ을 이용하여 Kaggle API Username, Key 세팅하기 os.environ['KAGGLE_USERNAME'] = 'jhighllight' os.environ['KAGGLE_KEY'] = 'xxxxxxxxxxxxxxxxxxxx' 데이터 다운로드 및 압축 해제하기 # Linux 명령어로 Kaggle API를 이용하여 데이터셋 다운로드하기 (!kaggle ~) # Linux 명령어로 압축 해제하기 !kaggl.. 2023. 3. 7. Part1. Chapter 01 - 데이터 분석으로 심부전증을 예방할 수 있을까 Step 0. 의료 데이터셋에 대하여 의료 데이터(바이오 데이터)를 갖고, 실제 분석하여 모델링하는 직무가 늘고 있는 추세입니다. 의료 영상(MRI, CT), 진료기록, 병원 공실률, 연구자료 등의 의료 빅데이터들이 전 세계적으로 활성화되어 있습니다. TP FP FN TN 정밀도 = TP / TP+FP ※ 예측시 옳을 확률 재현율 = TP / TP+FN ※ 실제 True 중 얼마나 맞췄는지에 대한 확률 Step 1. 데이터셋 준비하기 # 사용할 라이브러리 출력 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns Colab Notebook에 Kaggle API 세팅하기 # Kaggle user.. 2023. 3. 3. Kaggle 데이터 셋 다운로드 방법 캐글 데이터 셋 다운로드하기 앞서, 캐글 API 세팅하는 법을 아래 링크를 통해 완료하시길 바랍니다. Colab Notebook에 Kaggle API 세팅하는 방법 캐글로 데이터 분석을 하는 분들 굉장히 많을 텐데요. Colab Notebook으로 캐글 API 세팅하는 방법을 소개해드리겠습니다. 먼저, 'kaggle api'를 구글에 검색해 주세요. 본문 내용을 찾다 보면 하단 코드 highllight.tistory.com Datasets 캐글 사이트에 접속하면 'Datasets'이 존재하는데, 무수히 많은 주제와 관련한 데이터들이 있습니다. 저희는 캐글에 있는 데이터를 기반으로 데이터 분석을 할 수 있는데요. 저는 가장 상단에 위치한 'Dog breeds details' 데이터 셋을 클릭했습니다. 데이.. 2023. 3. 3. Colab Notebook에 Kaggle API 세팅하는 방법 캐글로 데이터 분석을 하는 분들 굉장히 많을 텐데요. Colab Notebook으로 캐글 API 세팅하는 방법을 소개해드리겠습니다. 먼저, 'kaggle api'를 구글에 검색해 주세요. 본문 내용을 찾다 보면 하단 코드가 보일 겁니다. export KAGGLE_USERNAME=jhighllight# 본인의 캐글 ID export KAGGLE_KEY=xxxxxxxxxxxxxx# 본인의 캐글 Key 본인의 캐글 아이디와 키를 확인하는 방법은 https://www.kaggle.com 주소를 클릭하여 캐글 회원가입 후, Account에 접속합니다. API 란에 보면 Create New API Token이 있는데, 클릭하면 kaggle.json이 다운로드되고, 이 파일에 본인의 캐글 유저 아이디와 키를 확인할 .. 2023. 3. 2. 이전 1 다음 반응형