맥주가 다른 상품들(기저귀, 바나나)과 같이 잘 팔리는 것 같은데, 상품 간 연관성이 있는 것일까?

 

장바구니 분석

    - 1993년 당시 IBM 직원 라케시 박사는 장바구니 분석 논문을 내놓았고, 이는 데이터 마이닝 학문의 시초가 되었다.

    - 1990년대 미국 슈퍼마켓 체인에서 맥주, 기저귀 간 강한 상관관계가 있다는 사실을 발견한 것. 

"육아는 피곤하다 -> 맥주가 필요하다"

"기저귀 심부름을 하는 길에 남편이 맥주를 사간다"

 

● 신뢰도 vs 향상도 : 연관성을 판단하는 기준

    - 신뢰도(confidence) : 맥주,기저귀 동시 구매 비율 / 기저귀 구매 비율 

      * 맹점 : 맥주는 원래부터 잘 팔리는 상품일 뿐, 기저귀와 연관성 있게 잘 팔리는 것은 아닐수도 있다.

    - 향상도(lift) : 맥주,기저귀 동시 구매 비율 / 기저귀 구매 비율 x 맥주 구매비율

      * 신뢰도의 맹점인, 두 상품의 판매 빈도까지 고려하는 지표

      * 보통 향상도가 1보다 크게 나오면 함께 팔릴 가능성이 높다고 보고, 1보다 작으면 함께 팔릴 가능성이 낮다고 봅니다.

 

● 장바구니 분석 결론 : 

바나나도 맥주만큼이나 기저귀와 함께 잘 팔리는 상품이었습니다. 그래서 기저귀와 바나나의 신뢰도(0.8)가 높게 나왔습니다.하지만 바나나는 그냥 원래 잘 팔리는 상품이었습니다. 즉, 기저귀 때문에 바나나가 잘 팔리는 것이 아니었던 것입니다.

그래서 기저귀와 바나나의 향상도는 낮게(0.91) 나온 것입니다.(향상도는 보통 1을 기준으로 높고 낮음을 결정합니다)

반면에 기저귀와 맥주는 향상도가 높으므로(1.6) 맥주를 기저귀 옆에 진열하게 되면 판매될 확률이 올라갈 것이라고 볼 수 있습니다.

 

+ Recent posts