[python] 기계학습 - 비지도학습 (연관규칙) - 기본 개념

2021. 6. 9. 09:02Python/문법

■ Association Rules (연관 규칙)

▶ 연관 규칙 마이닝의 기본 개념

TID Items
1 A, B
2 A, C, D, E
3 B, C D, F
4 A, B, C, D
5 A, B, C, F

 

 ● Frequent Itemset (빈발 항목집합)

   - Itemset (항목 집합)

     · 한 개 이상의 항목(들)의 집합 (ex. {F}, {A, B, C})

     · K-itemset: K개 항목을 가지는 항목집합   

   - Support Count: σ (지지도 카운트)

     · 항목집합이 나타나는 횟수 (ex. σ({A, B, C}) = 2)

   - Support: s (지지도)

     · 항목집합이 나타나는 트랜잭션의 비율 (ex. s({A, B, C}) = 2/5

   - Frequent Itemset (빈발 항목집합)

     · Support가 주어진 임계치(minsup)보다 큰 항목 집합 (ex. minsup=0.3이라면, {E}는 X, {A, B, C}는 O)

 

 ● Association Rules (연관 규칙)

   - Association Rules (연관 규칙)

     · X와 Y가 항목집합이라 할 때, X → Y 형태로 나타나는 함축 표현 (ex. {A, B} → {C})

   - Rule Evaluation Metrics (연관규칙 평가척도)

       ex. {A, B} → C

     · Support: s (지지도)       / s = X+Y / lTl = σ(A, B, C) / lTl = 2/5 = 0.4

       동일한 항목집합에서 나온 규칙들은 지지도가 동일하나 신뢰도는 다를 수 있음

     · Confidence: c (신뢰도) / c = X+Y / X = σ(A, B, C) / σ(A, B) = 2/3 = 0.67