Python(108)
-
[python] crawler (AirKorea)
Ver. Jupyter Notebook (Anaconda3) ▶ crawler_AirKorea 수집: 미세먼지, 초미세먼지 코딩: github JeongJaeyoung0/crawler Contribute to JeongJaeyoung0/crawler development by creating an account on GitHub. github.com 2021.05.13 # crawler_에어코리아 크롤링 step 1. 에어코리아 > 일평균, 년, 월, 대전 선택 > 검색 > 엑셀 pwd ### step 0. 준비 import sys # 시스템 import os # 시스템 import pandas as pd # 판다스 : 데이터분석 라이브러리 import numpy as np # 넘파이 : 숫자, 행렬 데..
2021.05.10 -
[python] crawler (소방청 국가화재정보센터)
Ver. Jupyter Notebook (Anaconda3) ▶ crawler_소방청 국가화재정보센터 수집: 화재 발생건수, 재산피해, 인명피해 부상, 인명피해 사망 코딩: github JeongJaeyoung0/crawler Contribute to JeongJaeyoung0/crawler development by creating an account on GitHub. github.com 2021.05.12 # crawler_소방청 국가화재정보센터 step 1. 소방청 > 시작 날짜 입력, 끝 날짜 입력, 지역 선택, 검색 클릭 > 크롤링 > 엑셀 저장 pwd ### step 0. 준비 import sys # 시스템 import os # 시스템 import pandas as pd # 판다스 : 데이터..
2021.05.09 -
[jupyter] 테마 변경
Ver. Jupyter Notebook (Anaconda3) ▶ 테마 변경 1. juptyerthemes 설치 cmd > pip install jupytertheme 2. 명령어 실행 - 테마 리스트 jt -l - 테마 변경 jt -t 테마이름 - 테마 초기화 jt -r
2021.05.08 -
[python] 분류
Ver. Jupyter Notebook (Anaconda3) ▶ 분류 ● 분류 알고리즘 - Decision Tree (결정 트리) - Logistic Regression (로지스틱 회귀) - Ensemble (앙상블) - Neural Network (신경망) - 등... ● graphviz 설치 방법 graphviz.org/download/#windows 다운로드 및 설치 cmd > pip install graphviz 시스템 환경 변수 편집 > 환경 변수 > 사용자 변수 > path > 편집 > 새로만들기 > graphviz 설치 경로\bin 시스템 환경 변수 편집 > 환경 변수 > 시스템 변수 > path > 편집 > 새로만들기 > graphviz 설치 경로\bin\dot.exe cmd > dot -..
2021.05.07 -
[python] 평가 (정확도, 오차행렬, 정밀도, 재현율)
Ver. Jupyter Notebook (Anaconda3) ▶ 정확도 정확도 = 예측 결과가동일한 데이터 건수 / 전체 예측 데이터 건수 # 이진 분류 시 좋은 평가 지표는 아니다. # 예) 0~10 숫자 중 0일 경우를 맞추는 문제에서, 모든 답을 아니라고 하면 정확도는 90%가 됨 더보기 >>> from sklearn.datasets import load_digits # mnist 데이터셋 로드 >>> from sklearn.model_selection import train_test_split >>> from sklearn.base import BaseEstim >>> from sklearn.metrics import accuracy_score >>> import numpy as np >>> im..
2021.05.06 -
[Python] 데이터 전처리 (원-핫 인코딩, 표준화, 정규화)
Ver. Jupyter Notebook (Anaconda3) ▶ 판다스의 원핫 인코딩 - sklearn의 레이블 인코딩, 원-핫 인코딩 방식은 복잡함. # padas의 get_dummies 함수를 이용하면 쉽게 원핫 인코딩 가능 >>> df = pd.DataFrame({'item':['TV','냉장고','전자렌지','컴퓨터','선풍기','선풍기','믹서','믹서'] }) >>> df pd.get_dummies(df) ▶ 피처 스케일링과 정규화 from sklearn.datasets import load_iris import pandas as pd iris = load_iris() iris_data = iris.data iris_df = pd.DataFrame(data=iris_data, columns=i..
2021.05.05