[Python] 데이터 전처리 (원-핫 인코딩, 표준화, 정규화)
Ver. Jupyter Notebook (Anaconda3) ▶ 판다스의 원핫 인코딩 - sklearn의 레이블 인코딩, 원-핫 인코딩 방식은 복잡함. # padas의 get_dummies 함수를 이용하면 쉽게 원핫 인코딩 가능 >>> df = pd.DataFrame({'item':['TV','냉장고','전자렌지','컴퓨터','선풍기','선풍기','믹서','믹서'] }) >>> df pd.get_dummies(df) ▶ 피처 스케일링과 정규화 from sklearn.datasets import load_iris import pandas as pd iris = load_iris() iris_data = iris.data iris_df = pd.DataFrame(data=iris_data, columns=i..
2021.05.05