Post

데이터 위클리 페이퍼 7 - 장바구니 분석(연관분석)

장바구니 분석의 활용 사례를 설명해주세요. 해당 사례에서 얻을 수 있는 비즈니스 인사이트는 무엇인지 구체적으로 설명해 주세요


  • 장바구니 분석 활용 사례 : 기저귀와 맥주
    • 한 대형 마트에서 고객들이 장바구니에 함께 담은 물건을 분석해보니, 기저귀와 맥주가 자주 함께 구매되는 경향이 관찰되었다
    • 이유를 찾아보니, 아이를 둔 아버지들이 마트에 방문할 때, 아이를 위한 기저귀를 사면서 자신이 마실 맥주도 함께 사는 패턴이 발견되었다
    • 장바구니 분석을 통해 겉으로는 전혀 연관성이 없어보이는 기저귀와 맥주의 연결 고리를 발견하면서 비즈니스 전략을 구성할 때 인사이트를 얻을 수 있었다
    • 이처럼 장바구니 분석은 보이지않는 상품 간의 특별한 연관성을 찾아내 기업이 효율적인 마케팅 방안을 구상하고 매출을 극대화할 수 있도록 해준다.
    • 또한, 고객 입장에서도 자신의 구매 패턴에 맞는 서비스를 제공받기에 만족도가 높아지면서 매출 증대와 고객 충성도 확보에도 도움이 될수있다


Support, Confidence, Lift 지표의 정의와 각 지표의 중요성을 설명해 주세요. 이 지표들을 해석하는 방법을 구체적인 예와 함께 설명해 주세요


장바구니 분석에서 상품 간의 연관 관계를 평가하기 위해 신뢰도와 지지도, 향상도를 이용합니다.

  • 지지도(Support)는 규칙의 일반성을 평가하며, 주어진 데이터 안에서 특정 아이템이 얼마나 자주 발생하는지 빈도를 측정하는 지표입니다. 이는 전체 거래 수 대비 특정 아이템이나 아이템세트가 포함된 거래의 비율로 측정되며, 지지도가 높을수록 해당 아이템이 전체 거래에 자주 나타나는 중요한 아이템이라는것을 보여줍니다.

  • 신뢰도(Confidence)는 특정 규칙이 얼마나 믿을 수 있는지를 나타내는 지표로, 조건품목을 샀을 때 결과품목을 함께 살 확률을 말하며 조건부 확률로 표현됩니다. 신뢰도가 높을수록 조건품목을 구매한 고객이 결과품목을 구매할 확률이 높다는 것을 의미합니다.

  • 향상도(Lift)는 규칙의 우연성을 평가하며, 두 아이템 간의 연관성이 우연히 발생할 확률에 비해, 실제로 함께 발생할 확률이 얼마나 더 높은지를 나타내는 지표입니다. 즉, A와 B가 우연이 아닌 상관관계가 있는지 판단합니다. 향상도가 1보다 크면 A와 B가 평균적으로 함께 발생하는 확률보다 높다는 의미이며, 1보다 작으면 두 아이템 간의 관계가 약하고 우연에 가깝다는 것을 나타냅니다. 향상도가 클수록 두 아이템 간의 강한 연관성이 있다고 볼 수 있습니다.

This post is licensed under CC BY 4.0 by the author.