Python(108)
-
[python] pandas 멀티 인덱스 읽기
Ver. Jupyter Notebook (Anaconda3) ▶ pandas 멀티 인덱스 읽기 ● 엑셀 데이터가 아래 사진과 같을 경우, 여러 열의 데이터를 인덱스로 지정하기 - index_col=[number, number, number, …] df = pd.read_excel(r'경로\파일명.xlsx', index_col=[0,1,2]) df
2021.05.24 -
[python] pandas 멀티 컬럼 읽기
Ver. Jupyter Notebook (Anaconda3) ▶ pandas 멀티 컬럼 읽기 ● 엑셀 데이터가 아래 사진과 같을 경우, 여러 행의 데이터를 컬럼으로 지정하기 - header=[number, number, number, …]) df = pd.read_excel(r'경로\파일명.xlsx', header=[0,1]) df
2021.05.23 -
[python] 추천시스템 - surprise
Ver. Jupyter Notebook (Anaconda3) ▶ surprise 패키지 - surpriselib.com - 쉽게 사용 가능 - Visual studio build tools 설치 되어 있어야 함 - 설치: cmd > pip install scikit-surprise ● 추천 수행 프로세스 - 데이터 로딩 · 데이터 컬럼 (무조건 userid, itemid, rating 순서로 데이터 정렬) · DataFrame에서 데이터 로딩 - 모델 설정 및 학습 · 추천 Algorithm 설정 (SVD, KNNBasic 등) · Train 데이터로 학습 (train() 메소드) - 예측 및 평가 · 예측 (test(): 전체 데이터 / predict(): 한개의 데이터) · 평가 (accuracy.r..
2021.05.22 -
[python] 추천시스템 - CF - MF(Matrix Factorization, 행렬 분해)
Ver. Jupyter Notebook (Anaconda3) ▶ 추천시스템 - CF - MF(Matrix Factorization, 행렬 분해) ● 잠재 요인 협업 필터링 - 사용자, 아이템 평점 행렬 속에 숨어있는 잠재 요인을 추출하여 예측 할 수 있는 기법 - SVD와 비슷한 개념이지만 다름 (SVD는 추천시스템에 사용하지 못함) - KNN 방식보다 정확함 - 넷플릭스에서 사용함 - 요약: 가진 데이터로 없는 데이터를 유추 # 임의의 3, 4 행렬 R = np.array([[4, 2, np.NaN, 2,], [np.NaN, 5, 4, np.NaN,], [1, np.NaN, 3, 4,]]) # K = 3으로 학습 num_users, num_items = R.shape K=3 # 잠재 요인은 3개 pri..
2021.05.21 -
[python] 리스트 축약 (데이터 중 특정 값이 포함된 데이터만 추출)
Ver. Jupyter Notebook (Anaconda3) ▶ A데이터 중 'C'가 포함된 값을 B에 저장 A = ['A', 'AB', 'B', 'CD', 'ABCD'] B = [x for x in A if 'C' in x] Out : ['CD', 'ABCD'] # 해석 A값을 하나씩 for의 x에 넣고 ( for x in A ) 'C'가 포함된 글자만 ( if 'C' in x ) 추출하여 B에 저장 ( B = [x ] )
2021.05.20 -
[wordcloud] naver cafe_게시판 글 목록
Ver. Jupyter Notebook (Anaconda3) ▶ naver cafe_게시판 글 목록 수집: 글 작성 상위 작성자(pie chart), 글 제목 (wordcloud), 좋아요 코딩: github JeongJaeyoung0/text_analysis 텍스트 감성분석. Contribute to JeongJaeyoung0/text_analysis development by creating an account on GitHub. github.com 2021.05.20 # wordcloud_naver cafe_게시글 목록 step 1. 글 작성 상위 20 작성자 pie chart step 2. 글 제목 wordcloud pwd ### step 0. 준비 import scipy as sp import ..
2021.05.20