Python(108)
-
[python] crawler (naver news)
Ver. Jupyter Notebook (Anaconda3) ▶ crawler_naver news 수집: 기사명, 날짜, 추천수, 좋아요…, 댓글 수, 댓글 코딩: github JeongJaeyoung0/crawler Contribute to JeongJaeyoung0/crawler development by creating an account on GitHub. github.com 2021.05.08 # crawler_naver news Step 1. 네이버 > 검색어 입력 > 뉴스> 네이버뉴스 url 수집 > 저장 (naver_news_url.xlsx) Step 2. naver_news_url.xlsx 불러오기 > 제목, 날짜, 댓글, 좋아요 크롤링 > 저장 (naver_news_keyword.xls..
2021.05.01 -
[python] crawler (naver blog)
Ver. Jupyter Notebook (Anaconda3) ▶ crawler_naver blog 수집: 제목, 닉네임, 날짜, 제목 코딩: github JeongJaeyoung0/crawler Contribute to JeongJaeyoung0/crawler development by creating an account on GitHub. github.com 2021.05.07 # crawler_naver blog Step 1. 네이버 > 검색어 입력 > VIEW > 블로그 > 옵션 > 기간 > url 수집 > 저장 (naver_blog_url.xlsx) Step 2. naver_blog_url.xlsx 불러오기 > 제목, 닉네임, 날짜, 제목 크롤링 > 저장 (naver_blog_content.xls..
2021.05.01 -
[python] crawler
Ver. Jupyter Notebook (Anaconda3) # 크롤러 하기위해 필요한것(cmd에서 설치) pip install selenium pip install regex (# 제거) pip install times pip install tqdm # 라이브러리 import sys# 시스템 import os# 시스템 import pandas as pd# 판다스 : 데이터분석 라이브러리 import numpy as np# 넘파이 : 숫자, 행렬 데이터 라이브러리 from bs4 import BeautifulSoup# html 데이터를 전처리 from selenium import webdriver# 웹 브라우저 자동화 from selenium.webdriver import ActionChains as A..
2021.04.30 -
[jupyter] 셀 너비 조정
Ver. Jupyter Notebook (Anaconda3) ▶ 셀 너비 조정 from IPython.core.display import display, HTML display(HTML(""))
2021.04.29 -
[Python] 데이터 시각화
Ver. Jupyter Notebook (Anaconda3) ▶ 시각화 하기 위해 필요한 데이터 install # Anaconda Prompt (Anaconda3) pip install tqdm pip install selenium ▶ 데이터 시각화 >>> import pandas as pd >>> import numpy as np >>> import matplotlib.pyplot as plt # 시각화 라이브러리 >>> import seaborn as sns # 시각화 라이브러리 >>> from tqdm import tqdm_notebook # for문 진행상황을 게이지로 알려줌 # 에러 무시 >>> import warnings >>> warnings.filterwarnings(action='igno..
2021.04.29 -
[python] kaggle, boston marathon
Ver. Jupyter Notebook (Anaconda3) ▶ 데이터 합치기 : concat >>> import pandas as pd >>> import numpy as np >>> marathon_2015 = pd.read_csv('./date_boston/marathon_results_2015.csv') >>> marathon_2016 = pd.read_csv('./date_boston/marathon_results_2016.csv') >>> marathon_2017 = pd.read_csv('./date_boston/marathon_results_2017.csv') marathon_2015['Year'] = '2015' marathon_2016['Year'] = '2016' marathon_20..
2021.04.29