2021. 6. 9. 09:02ㆍPython/문법
■ Association Rules (연관 규칙)
▶ 연관 규칙 마이닝의 기본 개념
TID | Items |
1 | A, B |
2 | A, C, D, E |
3 | B, C D, F |
4 | A, B, C, D |
5 | A, B, C, F |
● Frequent Itemset (빈발 항목집합)
- Itemset (항목 집합)
· 한 개 이상의 항목(들)의 집합 (ex. {F}, {A, B, C})
· K-itemset: K개 항목을 가지는 항목집합
- Support Count: σ (지지도 카운트)
· 항목집합이 나타나는 횟수 (ex. σ({A, B, C}) = 2)
- Support: s (지지도)
· 항목집합이 나타나는 트랜잭션의 비율 (ex. s({A, B, C}) = 2/5
- Frequent Itemset (빈발 항목집합)
· Support가 주어진 임계치(minsup)보다 큰 항목 집합 (ex. minsup=0.3이라면, {E}는 X, {A, B, C}는 O)
● Association Rules (연관 규칙)
- Association Rules (연관 규칙)
· X와 Y가 항목집합이라 할 때, X → Y 형태로 나타나는 함축 표현 (ex. {A, B} → {C})
- Rule Evaluation Metrics (연관규칙 평가척도)
ex. {A, B} → C
· Support: s (지지도) / s = X+Y / lTl = σ(A, B, C) / lTl = 2/5 = 0.4
동일한 항목집합에서 나온 규칙들은 지지도가 동일하나 신뢰도는 다를 수 있음
· Confidence: c (신뢰도) / c = X+Y / X = σ(A, B, C) / σ(A, B) = 2/3 = 0.67
'Python > 문법' 카테고리의 다른 글
[python] colab에서 github 파일 다운로드 & ipynb 파일 실행 (0) | 2021.07.20 |
---|---|
[python] pandas 멀티 인덱스 읽기 (0) | 2021.05.24 |
[python] pandas 멀티 컬럼 읽기 (0) | 2021.05.23 |
[python] 추천시스템 - surprise (0) | 2021.05.22 |
[python] 추천시스템 - CF - MF(Matrix Factorization, 행렬 분해) (0) | 2021.05.21 |