Python/문법(25)
-
[python] 분류
Ver. Jupyter Notebook (Anaconda3) ▶ 분류 ● 분류 알고리즘 - Decision Tree (결정 트리) - Logistic Regression (로지스틱 회귀) - Ensemble (앙상블) - Neural Network (신경망) - 등... ● graphviz 설치 방법 graphviz.org/download/#windows 다운로드 및 설치 cmd > pip install graphviz 시스템 환경 변수 편집 > 환경 변수 > 사용자 변수 > path > 편집 > 새로만들기 > graphviz 설치 경로\bin 시스템 환경 변수 편집 > 환경 변수 > 시스템 변수 > path > 편집 > 새로만들기 > graphviz 설치 경로\bin\dot.exe cmd > dot -..
2021.05.07 -
[python] 평가 (정확도, 오차행렬, 정밀도, 재현율)
Ver. Jupyter Notebook (Anaconda3) ▶ 정확도 정확도 = 예측 결과가동일한 데이터 건수 / 전체 예측 데이터 건수 # 이진 분류 시 좋은 평가 지표는 아니다. # 예) 0~10 숫자 중 0일 경우를 맞추는 문제에서, 모든 답을 아니라고 하면 정확도는 90%가 됨 더보기 >>> from sklearn.datasets import load_digits # mnist 데이터셋 로드 >>> from sklearn.model_selection import train_test_split >>> from sklearn.base import BaseEstim >>> from sklearn.metrics import accuracy_score >>> import numpy as np >>> im..
2021.05.06 -
[Python] 데이터 전처리 (원-핫 인코딩, 표준화, 정규화)
Ver. Jupyter Notebook (Anaconda3) ▶ 판다스의 원핫 인코딩 - sklearn의 레이블 인코딩, 원-핫 인코딩 방식은 복잡함. # padas의 get_dummies 함수를 이용하면 쉽게 원핫 인코딩 가능 >>> df = pd.DataFrame({'item':['TV','냉장고','전자렌지','컴퓨터','선풍기','선풍기','믹서','믹서'] }) >>> df pd.get_dummies(df) ▶ 피처 스케일링과 정규화 from sklearn.datasets import load_iris import pandas as pd iris = load_iris() iris_data = iris.data iris_df = pd.DataFrame(data=iris_data, columns=i..
2021.05.05 -
[python] 사이킷런으로 머신러닝
Ver. Jupyter Notebook (Anaconda3) ▶ 머신러닝의 용어 # 피처(Feature), 속성 : 데이터, 타겟값을 제외한 나머지 속성 ex) 꽃잎의 크기 (length, width) # 레이블, 클래스, 타겟값, 결정값 : 정답 데이터 ex) 품종 (Setosa, Vesicolor, Virginica) # 학습 데이터 : 지도학습 할 데이터 # 테스트 데이터 : 학습을 기반으로 테스트할 데이터 ▶ 머신러닝의 종류 # 교차 검증 - KFold - Stratified KFold * cross_val_score() : 간략한 코드 * GridSearchCV : 교차 검증 + 하이퍼 파라미터 튜닝 (모델의 성능을 최대로 끌어올리는 학습 조건) ▶ GridSearchCV >>> import p..
2021.05.04 -
[python] numpy
Ver. Jupyter Notebook (Anaconda3) ▶ Numpy ndarray 개요 >>> import numpy as np # ndarray 생성 np.array() >>> list1 = [1, 2, 3] >>> print("list1:", list1) >>> print("list1 type:", type(list1)) list1: [1, 2, 3] list1 type: >>> array1 = np. array(list1) >>> print("array1:", array1) >>> print("array1 type:", type(array1)) array1: [1 2 3] array1 type: # ndarray의 형태(shape)와 차원 ## 1차원 >>> array1 = np.array(..
2021.05.03 -
[python] crawler
Ver. Jupyter Notebook (Anaconda3) # 크롤러 하기위해 필요한것(cmd에서 설치) pip install selenium pip install regex (# 제거) pip install times pip install tqdm # 라이브러리 import sys# 시스템 import os# 시스템 import pandas as pd# 판다스 : 데이터분석 라이브러리 import numpy as np# 넘파이 : 숫자, 행렬 데이터 라이브러리 from bs4 import BeautifulSoup# html 데이터를 전처리 from selenium import webdriver# 웹 브라우저 자동화 from selenium.webdriver import ActionChains as A..
2021.04.30