아마존 뷰티 제품 평점 정보: 2M 개 이상의 고객 리뷰와 평점 정보를 포함한 데이터셋을 가지고 인기 제품 추천과 을 만들어 보자. 앞서 영화 추천과 비슷하게 진행가능하다. 데이터셋에는 총 4가지 정보가 포함되어 있다: 앞서 2일 차와 4일 차 강의 내용을 기반으로 인기도 기반의 추천과 SVD 기반의 추천을 만들어 보자 import pandas as pd import numpy as np amazon_ratings = pd.read_csv("https://grepp-reco-test.s3.ap-northeast-2.amazonaws.com/ratings_Beauty.csv") 4가지 정보 중에 하나라도 비어있는 레코드들을 모두 날리고 처음 5개의 레코드를 살펴본다. amazon_ratings = amaz..
실전 프로젝트 - CNN 기반 이미지 분류 모델의 강건성 평가 다양한 딥러닝 분류 모델이 자율 주행 자동차, 얼굴 인식 등 보안(security)이 중요한 분야에서 활용되고 있습니다. 본 프로젝트에서는 공격자 입장에서 딥러닝 모델을 평가하는 적대적 공격 기법에 대하여 공부하게 됩니다. GPU 가속기를 이용하기 위해 [런타임] - [런타임 유형 변경] - [GPU]를 선택합니다. 본 프로젝트를 잘 수행하기 위해 다음의 YouTube 학습 자료를 참고하세요. 본 프로젝트에서는 다음의 두 가지 대표적인 공격 기법을 실습합니다. 본 프로젝트는 총 5개의 문제로 구성됩니다. Problem 5에서 최대한 높은 공격력(낮은 모델 정확도)을 내는 것이 여러분의 최종 목표입니다. 최종적으로 팀 단위로 제출할 파일은 다음..
Darknet을 이용하여 커스텀 YOLOv3을 빌드하기 This tutorial is a copy of the one made by 'The AI Guy'. The link to the original tutorial and the author is : The AI Guy 폴더등과 관련된 몇 가지 오류를 수정하고 한글화함 1. Darknet를 clone하기 다음 셀들은 AlexeyAB repository에서 darknet을 clone하고 darknet에서 OPENCV and GPU의 사용을 enable하기 위해 make파일을 수정하고 darknet을 빌드함 In [1]: # darknet repository에서 clone하기 !git clone https://github.com/AlexeyAB/darkn..
NLP: 텍스트 전처리 자연어 처리 텍스트 전처리 자연어 처리 소개 자연어의 의미를 컴퓨터로 분석해서 특정 작업을 위해 사용할 수 있도록 하는 것 응용분야 기계번역 감성분석 문서분류 질의응답시스템 챗봇 언어생성 음성인식 추천시스템 다른 분야처럼 보이는 것도 다 이어져 있는 것을 알 수 있음 단어(Word) 다음 문장은 몇 개의 단어를 가지고 있나? He stepped out into the hall, was delighted to encounter a water brother. 문장부호를 단어에 포함시켜야 할까? 구어체 문장의 경우 I do uh main - mainly business data processing Fragments(깨어진 단어), filled pauses(uh, um) “Seuss”s ..
1. Big Data: 데이터 팀의 역할 데이터 팀의 미션 신뢰할 수 있는 데이터를 바탕으로 부가가치 생성, 데이터는 새로운 오일 등이라고 하지만, 항상 데이터 팀의 부가가치를 창출하는 것. 사측에서 기대하는 만큼, 어떤 이익을 창출해 줄지 고민해야 함. 데이터 팀의 목표 1 -고품질의 데이터를 제공하여 정책 결정에 사용 -결정과학(Decision Science)라고 부르기도 함 데이터 참고 결정(data informed decisions)을 가능하게 함 vs. 데이터 기반 결정(data driven decisions) 데이터 팀의 목표 2 -고품질 데이터를 필요할 때 제공하여 사용자의 서비스 경험 개선 머신 러닝과 같은 데이터 기반 알고리즘을 통해 개선 예) 개인화를 바탕으로한 추천(Recommenda..
실전 프로젝트 - CNN을 활용한 풍경(Scene) 이미지 분류 한 장의 풍경 이미지가 주어졌을 때, 어떠한 카테고리(category)에 속하는지 맞히는 분류 모델을 만드세요. 다음의 세 가지 대표적인 CNN 모델을 실습합니다. 성능을 올릴 수 있는 두 가지 심화 기법을 실습합니다. 본 프로젝트는 총 7개의 문제로 구성됩니다. (참고) 본 실습 코드에서는 빠른 결과 도출을 위해 30~50 epoch 정도만 학습합니다. Problem 1. 데이터셋 다운로드 및 분석하기 # 깃허브에서 데이터셋 다운로드하기 !git clone https://github.com/ndb796/Scene-Classification-Dataset-Split # 폴더 안으로 이동 %cd Scene-Classification-Datas..
- Total
- Today
- Yesterday
- 인공지능
- 캐글
- 프로그래머스
- 데이터사이언스
- 프로그래밍
- 머신러닝
- 쿼리 테스트
- sql 테스트
- 파이썬
- Kaggle
- SQLD
- LV2
- ML
- mysql
- EDA
- 부스트코스
- Lv3
- API
- 딥러닝
- 알고리즘
- ai
- 데이터 시각화
- 데이터 분석
- 태블로
- SQL
- nlp
- LV1
- 데이터분석
- lv4
- Python
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |