연관 규칙 : 장바구니 분석의 물품 사이 관계의 패턴
{peanut butter, jelly} ->{bread}
ex)
- 암 데이터 분석에서 단백질 서열과 자주 발견되는 흥미로운 DNA의 패턴 찾기
- 구매 패턴, 사기 신용카드나 보험과 복잡해 발생하는 의료 청구 발견하기
- 휴대폰 서비스를 정지하거나 케이블 텔레비전 패키지를 업그레이드하려는 행위의 사전 조합
식별하기
Apriori 알고리즘
장점
● 매우 대량의 거래 데이터와 작동이 이상적으로 적합하다.
● 쉽게 이해할 수 있는 결과를 내놓는다.
● '데이터 마이닝'에 유용하고 데이터베이스 안에 예상하지 못한 지식을 발견한다.
단점
● 작은 데이터셋에 유용하지 않다.
● 상식과 통찰력을 구별해야 한다.
● 무작위 패턴에서 거짓된 결과를 끄집어내기 쉽다.
규칙 흥미 측정
● 지지도 support(X)=count(X)/N
● 신뢰도 confidence(X->Y) = support(X,Y)/support(X)
● 향상도 lift(X->Y) = confidence(X->Y)/support(Y)
'Machine Learning' 카테고리의 다른 글
AI 개발의 스포트라이트 ‘MLOps’ (0) | 2021.04.27 |
---|---|
Docker 환경 구성 (huggingface) docker build 명령어 (0) | 2020.08.26 |
군집화 이해 (0) | 2019.09.26 |
Strategy Pattern (0) | 2019.09.26 |