Python/문법(25)
-
[python] colab에서 github 파일 다운로드 & ipynb 파일 실행
▶ colab에서 github 파일 다운로드 & ipynb 파일 실행 - 코딩 : github ● github 파일 다운로드# 깃허브 다운로드!pwd!git clone https://github.com/JeongJaeyoung0/function.git # 다운 받을 깃허브 clone 링크!git pull # 저장소에서 변경 사항을 가져오기 위한%cd ./function # 폴더로 진입!ls ● ipynb 파일 실행# ipynb 파일 실행!pip install import_ipynb # 코랩에서 ipynb 파일 실행 하기위한import import_ipynb # 라이브러리 불러오기from prime_number import prime_number # n까지의 소수 리스트 출력 (..
2021.07.20 -
[python] 기계학습 - 비지도학습 (연관규칙) - 기본 개념
■ Association Rules (연관 규칙) ▶ 연관 규칙 마이닝의 기본 개념 TID Items 1 A, B 2 A, C, D, E 3 B, C D, F 4 A, B, C, D 5 A, B, C, F ● Frequent Itemset (빈발 항목집합) - Itemset (항목 집합) · 한 개 이상의 항목(들)의 집합 (ex. {F}, {A, B, C}) · K-itemset: K개 항목을 가지는 항목집합 - Support Count: σ (지지도 카운트) · 항목집합이 나타나는 횟수 (ex. σ({A, B, C}) = 2) - Support: s (지지도) · 항목집합이 나타나는 트랜잭션의 비율 (ex. s({A, B, C}) = 2/5 - Frequent Itemset (빈발 항목집합) · Su..
2021.06.09 -
[python] pandas 멀티 인덱스 읽기
Ver. Jupyter Notebook (Anaconda3) ▶ pandas 멀티 인덱스 읽기 ● 엑셀 데이터가 아래 사진과 같을 경우, 여러 열의 데이터를 인덱스로 지정하기 - index_col=[number, number, number, …] df = pd.read_excel(r'경로\파일명.xlsx', index_col=[0,1,2]) df
2021.05.24 -
[python] pandas 멀티 컬럼 읽기
Ver. Jupyter Notebook (Anaconda3) ▶ pandas 멀티 컬럼 읽기 ● 엑셀 데이터가 아래 사진과 같을 경우, 여러 행의 데이터를 컬럼으로 지정하기 - header=[number, number, number, …]) df = pd.read_excel(r'경로\파일명.xlsx', header=[0,1]) df
2021.05.23 -
[python] 추천시스템 - surprise
Ver. Jupyter Notebook (Anaconda3) ▶ surprise 패키지 - surpriselib.com - 쉽게 사용 가능 - Visual studio build tools 설치 되어 있어야 함 - 설치: cmd > pip install scikit-surprise ● 추천 수행 프로세스 - 데이터 로딩 · 데이터 컬럼 (무조건 userid, itemid, rating 순서로 데이터 정렬) · DataFrame에서 데이터 로딩 - 모델 설정 및 학습 · 추천 Algorithm 설정 (SVD, KNNBasic 등) · Train 데이터로 학습 (train() 메소드) - 예측 및 평가 · 예측 (test(): 전체 데이터 / predict(): 한개의 데이터) · 평가 (accuracy.r..
2021.05.22 -
[python] 추천시스템 - CF - MF(Matrix Factorization, 행렬 분해)
Ver. Jupyter Notebook (Anaconda3) ▶ 추천시스템 - CF - MF(Matrix Factorization, 행렬 분해) ● 잠재 요인 협업 필터링 - 사용자, 아이템 평점 행렬 속에 숨어있는 잠재 요인을 추출하여 예측 할 수 있는 기법 - SVD와 비슷한 개념이지만 다름 (SVD는 추천시스템에 사용하지 못함) - KNN 방식보다 정확함 - 넷플릭스에서 사용함 - 요약: 가진 데이터로 없는 데이터를 유추 # 임의의 3, 4 행렬 R = np.array([[4, 2, np.NaN, 2,], [np.NaN, 5, 4, np.NaN,], [1, np.NaN, 3, 4,]]) # K = 3으로 학습 num_users, num_items = R.shape K=3 # 잠재 요인은 3개 pri..
2021.05.21