Python(105)
-
[crawler] naver cafe_게시판 글 목록
Ver. Jupyter Notebook (Anaconda3) ▶ crawler_naver cafe_게시판 글 목록 수집: 글 번호, 제목, 작성자, 좋아요 코딩: github JeongJaeyoung0/crawler Contribute to JeongJaeyoung0/crawler development by creating an account on GitHub. github.com 2021.05.19 # crawler_naver cafe_게시판 글 목록 Step 1. 네이버 카페 > 게시판 > 글번호, 제목, 작성자, 좋아요 수집 > 저장 (crawler_naver cafe_게시판 {}.xlsx) pwd # 공지 숨겨도 크롤링에 포함됨 # 공지 숨기기 클릭 # anno_off = driver.find_e..
2021.05.19 -
[python] 추천 시스템
Ver. Jupyter Notebook (Anaconda3) ▶ 추천 시스템 종류 ● CBF (Content-based Filtering) ex) 영화 : 장르, 감독, 출연배우, 키워드 # 넷프릭스 ● CF (Collaborative Filtering) - KNN (K-nearest Neighbors) · 아이템 기반 # 아마존 (사용자 기반보다 좀더 정확하다고 함) · 사용자 기반 # 왓챠 - MF (Matrix Factorization) # 넷플릭스 ▶ 유사도를 측정하는 방법 ● 거리 기반 ● 각도 기반 - 코사인 유사도 (가장 많이 사용) - 자카드 유사도 - 피어슨 유사도
2021.05.18 -
[python] crawler_google image
Ver. Jupyter Notebook (Anaconda3) ▶ crawler_google image 수집: 사진 코딩: github JeongJaeyoung0/crawler Contribute to JeongJaeyoung0/crawler development by creating an account on GitHub. github.com 2021.05.18 # crawler_youtube image Step 1. 구글 검색 > 이미지 > 이미지 저장 pwd ### step 0. 준비 import pandas as pd import numpy as np import os import urllib.request from selenium import webdriver from tqdm import tqdm..
2021.05.18 -
[crawler] youtube(selenium)
Ver. Jupyter Notebook (Anaconda3) ▶ crawler_yotube(selenium) 수집: 제목, 조회수, 날짜, 좋아요, 싫어요, 댓글 코딩: github JeongJaeyoung0/crawler Contribute to JeongJaeyoung0/crawler development by creating an account on GitHub. github.com 210517 # crawler_Youtube step 1. url 수집: 검색어 입력, 크롤링 글 개수 입력 step 2. 크롤링: 제목, 조회수, 날짜, 좋아요, 싫어요, 댓글 pwd ### step 0. 준비 import sys # 시스템 import os # 시스템 import pandas as pd # 판다스 :..
2021.05.17 -
[jupyter] 디렉토리 변경
Ver. Jupyter Notebook (Anaconda3) ▶ 디렉토리 변경 1. configure 파일 생성하기 cmd > jupyter notebook --generate-config 2. 생성된 파일 열기 C:\Users\컴퓨터명\.jupyter\jupyter_notebook_config.py 3. # 삭제, 디렉토리 경로 지정 # c.NotebookApp.notebook_dir = '' 를 아래와 같이 변경 c.NotebookApp.notebook_dir = 'G:\내 드라이브' 4. Jupyter Notebook 우클릭 > 파일 위치 열기 > Jupyter Notebook (Anaconda3) 우클릭 > 속성 [대상]의 "%USERPROFILE%/" 삭제 (4번까지 설정해도 안될 경우) 5. ..
2021.05.16 -
파이썬을 이용한 크롤링 무료로 도와드립니다
파이썬 입문자이며, 공부 할 목적으로 크롤링 도와드립니다. 제가 올린 글의 수준을 확인하시고, 아래 조건에도 괜찮으시면 댓글 남겨주세요. 조건 1. 일반적인 방법(검색, 서치로 접근 가능한)인 크롤링만 가능. 조건 2. 배우는 입장이기에 수준급 코드, 데이터는 어려울 수 있으며, 퀄리티 또한 전문가 수준에 못미칠 것을 감안. 조건 3. 능력 밖의 크롤링은 시간이 오래걸리거나 실패 할 수도 있음. 조건 4. 아주 많은 양(크롤링 하는데 반나절 이상 걸릴 수준)은 코드만 짜 드리고, 크롤링은 직접 수행.
2021.05.15