전체 글(231)
-
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter11 분류 분석
01 [로지스틱 회귀 분석] 특징 데이터로 유방암 진단하기 사이킷런 의 유방암 진단 데이터셋 사용하기 import numpy as np import pandas as pd from sklearn.datasets import load_breast_cancer b_cancer = load_breast_cancer() print(b_cancer.DESCR) .. _breast_cancer_dataset: Breast cancer wisconsin (diagnostic) dataset -------------------------------------------- **Data Set Characteristics:** :Number of Instances: 569 :Number of Attributes: 30 n..
2023.01.10 -
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter10 회귀 분석
01 [선형 회귀 분석 + 산점도/선형 회귀 그래프] 환경에 따른 주택 가격 예측하기 !pip install sklearn Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/ Collecting sklearn Downloading sklearn-0.0.post1.tar.gz (3.6 kB) Preparing metadata (setup.py) ... done Building wheels for collected packages: sklearn Building wheel for sklearn (setup.py) ... done Created wheel for sklearn: file..
2023.01.09 -
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter09 지리 정보 분석
01 [주소 데이터 분석 + 지오맵] 지리 정보 분석 후 맵 생성하기 import pandas as pd CB = pd.read_csv('CoffeeBean.csv', encoding = 'CP949', index_col = 0, header = 0, engine = 'python') CB.head() #작업 내용 확인용 출력 addr = [] for address in CB.address: addr.append(str(address).split()) addr #작업 내용 확인용 출력 [['서울시', '강남구', '학동로', '211', '1층'], ['서울시', '강남구', '광평로', '280', '수서동', '724호'], ['서울시', '강남구', '논현로', '566', '강남차병원1층'], [..
2023.01.09 -
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter08 텍스트 빈도 분석
01 [영문 분석 + 워드클라우드] 영문 문서 제목의 키워드 분석하기 !pip install matplotlib !pip install wordcloud !pip install nltk Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/ Requirement already satisfied: matplotlib in /usr/local/lib/python3.8/dist-packages (3.2.2) Requirement already satisfied: numpy>=1.11 in /usr/local/lib/python3.8/dist-packages (from matplotlib) ..
2023.01.08 -
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter07 통계분석
01 [기술 통계 분석 + 그래프] 와인 품질 등급 예측하기 from google.colab import files uploaded = files.upload() winequality-red.csv winequality-red.csv(text/csv) - 84199 bytes, last modified: 2023. 1. 7. - 100% done Saving winequality-red.csv to winequality-red.csv uploaded = files.upload() winequality-white.csv winequality-white.csv(text/csv) - 264426 bytes, last modified: 2023. 1. 7. - 100% done Saving winequality..
2023.01.08 -
데이터 과학 기반의 파이썬 빅데이터 분석 Chapter06 파이썬 크롤링 - 라이브러리 이용
정적 웹 페이지 크롤링 준비 1.1 BeautifulSoup 연습하기 1 from bs4 import BeautifulSoup 연습용 html 작성 html = '한빛출판네트워크로그인한빛미디어한빛아카데미' BeutifulSoup 객체 생성 soup = BeautifulSoup(html, 'html.parser') 객체에 저장된 html 내용 확인 print(soup.prettify()) 한빛출판네트워크 로그인 한빛미디어 한빛아카데미 1.2 BeautifulSoup 연습하기 2 태그 파싱하기: 지정된 한 개의 태그만 파싱 한다. soup.h1 한빛출판네트워크 tag_h1 = soup.h1 tag_h1 한빛출판네트워크 tag_div = soup.div tag_div 로그인한빛미디어ul.brand>li") l..
2023.01.06