Python/데이터 과학 기반의 파이썬 빅데이터 분석(한빛 아카데미)(10)
-
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter07 통계분석
01 [기술 통계 분석 + 그래프] 와인 품질 등급 예측하기 from google.colab import files uploaded = files.upload() winequality-red.csv winequality-red.csv(text/csv) - 84199 bytes, last modified: 2023. 1. 7. - 100% done Saving winequality-red.csv to winequality-red.csv uploaded = files.upload() winequality-white.csv winequality-white.csv(text/csv) - 264426 bytes, last modified: 2023. 1. 7. - 100% done Saving winequality..
2023.01.08 -
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter06 파이썬 크롤링 - 라이브러리 이용
정적 웹 페이지 크롤링 준비 1.1 BeautifulSoup 연습하기 1 from bs4 import BeautifulSoup 연습용 html 작성 html = '한빛출판네트워크로그인한빛미디어한빛아카데미' BeutifulSoup 객체 생성 soup = BeautifulSoup(html, 'html.parser') 객체에 저장된 html 내용 확인 print(soup.prettify()) 한빛출판네트워크 로그인 한빛미디어 한빛아카데미 1.2 BeautifulSoup 연습하기 2 태그 파싱하기: 지정된 한 개의 태그만 파싱 한다. soup.h1 한빛출판네트워크 tag_h1 = soup.h1 tag_h1 한빛출판네트워크 tag_div = soup.div tag_div 로그인한빛미디어ul.brand>li") l..
2023.01.06 -
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter05 파이썬 크롤링-API 이용
01. 네이버 API를 이용한 크롤링 [CODE 0] 먼저, 전체 작업 스토리를 설계한다. def main(): node = 'news' #크롤링할 대상 srcText = input('검색어를 입력하세요: ') cnt = 0 jsonResult = [] jsonResponse = getNaverSearch(node, srcText, 1, 100) #[CODE 2] total = jsonResponse['total'] while ((jsonResponse != None) and (jsonResponse['display'] != 0)): for post in jsonResponse['items']: cnt += 1 getPostData(post, jsonResult, cnt) #[CODE 3] start =..
2023.01.05 -
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter04 파이썬 프로그래밍 기초 연습문제
07. pandas의 DataFrame 자료형으로 저장한 뒤 CSV파일에 저장하시오. import pandas as pd df = pd.DataFrame([[500, 450, 520, 610], [690, 700, 820, 900], [1100, 1030, 1200, 1380], [1500, 1650, 1700, 1850], [1990, 2020, 2300, 2420], [1020, 1600, 2200, 2550]], index = ['2015', '2016', '2017', '2018', '2019', '2020'], columns = ['1분기', '2분기', '3분기', '4분기']) df df.to_csv('Users', header = 'False') 08. 07번의 데이터를 이용하여 연도별 라..
2023.01.05