본문 바로가기

Machine Learning

연관 규칙을 사용한 장바구니 분석

연관 규칙 : 장바구니 분석의 물품 사이 관계의 패턴

 

{peanut butter, jelly} ->{bread}

 

ex)

-   암 데이터 분석에서 단백질 서열과 자주 발견되는 흥미로운 DNA의 패턴 찾기

-   구매 패턴, 사기 신용카드나 보험과 복잡해 발생하는 의료 청구 발견하기

-   휴대폰 서비스를 정지하거나 케이블 텔레비전 패키지를 업그레이드하려는 행위의 사전 조합

    식별하기

 

 

Apriori 알고리즘

 

 

장점

● 매우 대량의 거래 데이터와 작동이 이상적으로 적합하다.

● 쉽게 이해할 수 있는 결과를 내놓는다.

● '데이터 마이닝'에 유용하고 데이터베이스 안에 예상하지 못한 지식을 발견한다.

 

단점 

 

● 작은 데이터셋에 유용하지 않다.

● 상식과 통찰력을 구별해야 한다.

● 무작위 패턴에서 거짓된 결과를 끄집어내기 쉽다.

 

 

규칙 흥미 측정

 

 ● 지지도   support(X)=count(X)/N

 ● 신뢰도   confidence(X->Y) = support(X,Y)/support(X)

 ● 향상도   lift(X->Y) = confidence(X->Y)/support(Y)

'Machine Learning' 카테고리의 다른 글

AI 개발의 스포트라이트 ‘MLOps’  (0) 2021.04.27
Docker 환경 구성 (huggingface) docker build 명령어  (0) 2020.08.26
군집화 이해  (0) 2019.09.26
Strategy Pattern  (0) 2019.09.26