데이터 위클리 페이퍼 7 - 장바구니 분석(연관분석)
- 데이터 위클리 페이퍼 12 - 머신러닝 편향과 분산, K-폴드
- 데이터 위클리 페이퍼 11 - 지도학습과 비지도학습, 손실 함수
- 데이터 위클리 페이퍼 10 - A/B테스트, Event Taxonomy
- 데이터 위클리 페이퍼 9 - AARRR 사례 분석
- 데이터 위클리 페이퍼 8 - AARRR, 코호트와 세그먼트, RFM
- 데이터 위클리 페이퍼 6 - 클러스터링, 고유값과 고유벡터, 히스토그램
- 데이터 위클리 페이퍼 5 - 사분위수, 기술통계와 추론통계
- 데이터 위클리 페이퍼 4 - 데이터 전처리와 t-test
- 데이터 위클리 페이퍼 3 - 제1종 오류와 제2종 오류, p-value
- 데이터 위클리 페이퍼 2 - 유닉스 절대경로와 상대경로, 깃 브랜치
- 데이터 위클리 페이퍼 1 - 클래스와 인스턴스, 정적 메소드
장바구니 분석의 활용 사례를 설명해주세요. 해당 사례에서 얻을 수 있는 비즈니스 인사이트는 무엇인지 구체적으로 설명해 주세요
- 장바구니 분석 활용 사례 : 기저귀와 맥주
- 한 대형 마트에서 고객들이 장바구니에 함께 담은 물건을 분석해보니, 기저귀와 맥주가 자주 함께 구매되는 경향이 관찰되었다
- 이유를 찾아보니, 아이를 둔 아버지들이 마트에 방문할 때, 아이를 위한 기저귀를 사면서 자신이 마실 맥주도 함께 사는 패턴이 발견되었다
- 장바구니 분석을 통해 겉으로는 전혀 연관성이 없어보이는 기저귀와 맥주의 연결 고리를 발견하면서 비즈니스 전략을 구성할 때 인사이트를 얻을 수 있었다
- 이처럼 장바구니 분석은 보이지않는 상품 간의 특별한 연관성을 찾아내 기업이 효율적인 마케팅 방안을 구상하고 매출을 극대화할 수 있도록 해준다.
- 또한, 고객 입장에서도 자신의 구매 패턴에 맞는 서비스를 제공받기에 만족도가 높아지면서 매출 증대와 고객 충성도 확보에도 도움이 될수있다
Support, Confidence, Lift 지표의 정의와 각 지표의 중요성을 설명해 주세요. 이 지표들을 해석하는 방법을 구체적인 예와 함께 설명해 주세요
장바구니 분석에서 상품 간의 연관 관계를 평가하기 위해 신뢰도와 지지도, 향상도를 이용합니다.
지지도(Support)
는 규칙의 일반성을 평가하며, 주어진 데이터 안에서 특정 아이템이 얼마나 자주 발생하는지 빈도를 측정하는 지표입니다. 이는 전체 거래 수 대비 특정 아이템이나 아이템세트가 포함된 거래의 비율로 측정되며, 지지도가 높을수록 해당 아이템이 전체 거래에 자주 나타나는 중요한 아이템이라는것을 보여줍니다.신뢰도(Confidence)
는 특정 규칙이 얼마나 믿을 수 있는지를 나타내는 지표로, 조건품목을 샀을 때 결과품목을 함께 살 확률을 말하며 조건부 확률로 표현됩니다. 신뢰도가 높을수록 조건품목을 구매한 고객이 결과품목을 구매할 확률이 높다는 것을 의미합니다.향상도(Lift)
는 규칙의 우연성을 평가하며, 두 아이템 간의 연관성이 우연히 발생할 확률에 비해, 실제로 함께 발생할 확률이 얼마나 더 높은지를 나타내는 지표입니다. 즉, A와 B가 우연이 아닌 상관관계가 있는지 판단합니다. 향상도가 1보다 크면 A와 B가 평균적으로 함께 발생하는 확률보다 높다는 의미이며, 1보다 작으면 두 아이템 간의 관계가 약하고 우연에 가깝다는 것을 나타냅니다. 향상도가 클수록 두 아이템 간의 강한 연관성이 있다고 볼 수 있습니다.
This post is licensed under CC BY 4.0 by the author.