데이터 위클리 페이퍼 7 - 장바구니 분석(연관분석)
- 데이터 위클리 페이퍼 12 - 머신러닝 편향과 분산, K-폴드
- 데이터 위클리 페이퍼 11 - 지도학습과 비지도학습, 손실 함수
- 데이터 위클리 페이퍼 10 - A/B테스트, Event Taxonomy
- 데이터 위클리 페이퍼 9 - AARRR 사례 분석
- 데이터 위클리 페이퍼 8 - AARRR, 코호트와 세그먼트, RFM
- 데이터 위클리 페이퍼 6 - 클러스터링, 고유값과 고유벡터, 히스토그램
- 데이터 위클리 페이퍼 5 - 사분위수, 기술통계와 추론통계
- 데이터 위클리 페이퍼 4 - 데이터 전처리와 t-test
- 데이터 위클리 페이퍼 3 - 제1종 오류와 제2종 오류, p-value
- 데이터 위클리 페이퍼 2 - 유닉스 절대경로와 상대경로, 깃 브랜치
- 데이터 위클리 페이퍼 1 - 클래스와 인스턴스, 정적 메소드
장바구니 분석의 활용 사례를 설명해주세요. 해당 사례에서 얻을 수 있는 비즈니스 인사이트는 무엇인지 구체적으로 설명해 주세요
- 장바구니 분석 활용 사례 : 기저귀와 맥주
- 한 대형 마트에서 고객들이 장바구니에 함께 담은 물건을 분석해보니, 기저귀와 맥주가 자주 함께 구매되는 경향이 관찰되었다
- 이유를 찾아보니, 아이를 둔 아버지들이 마트에 방문할 때, 아이를 위한 기저귀를 사면서 자신이 마실 맥주도 함께 사는 패턴이 발견되었다
- 장바구니 분석을 통해 겉으로는 전혀 연관성이 없어보이는 기저귀와 맥주의 연결 고리를 발견하면서 비즈니스 전략을 구성할 때 인사이트를 얻을 수 있었다
- 이처럼 장바구니 분석은 보이지않는 상품 간의 특별한 연관성을 찾아내 기업이 효율적인 마케팅 방안을 구상하고 매출을 극대화할 수 있도록 해준다.
- 또한, 고객 입장에서도 자신의 구매 패턴에 맞는 서비스를 제공받기에 만족도가 높아지면서 매출 증대와 고객 충성도 확보에도 도움이 될수있다
Support, Confidence, Lift 지표의 정의와 각 지표의 중요성을 설명해 주세요. 이 지표들을 해석하는 방법을 구체적인 예와 함께 설명해 주세요
장바구니 분석에서 상품 간의 연관 관계를 평가하기 위해 신뢰도와 지지도, 향상도를 이용합니다.
지지도(Support)는 규칙의 일반성을 평가하며, 주어진 데이터 안에서 특정 아이템이 얼마나 자주 발생하는지 빈도를 측정하는 지표입니다. 이는 전체 거래 수 대비 특정 아이템이나 아이템세트가 포함된 거래의 비율로 측정되며, 지지도가 높을수록 해당 아이템이 전체 거래에 자주 나타나는 중요한 아이템이라는것을 보여줍니다.신뢰도(Confidence)는 특정 규칙이 얼마나 믿을 수 있는지를 나타내는 지표로, 조건품목을 샀을 때 결과품목을 함께 살 확률을 말하며 조건부 확률로 표현됩니다. 신뢰도가 높을수록 조건품목을 구매한 고객이 결과품목을 구매할 확률이 높다는 것을 의미합니다.향상도(Lift)는 규칙의 우연성을 평가하며, 두 아이템 간의 연관성이 우연히 발생할 확률에 비해, 실제로 함께 발생할 확률이 얼마나 더 높은지를 나타내는 지표입니다. 즉, A와 B가 우연이 아닌 상관관계가 있는지 판단합니다. 향상도가 1보다 크면 A와 B가 평균적으로 함께 발생하는 확률보다 높다는 의미이며, 1보다 작으면 두 아이템 간의 관계가 약하고 우연에 가깝다는 것을 나타냅니다. 향상도가 클수록 두 아이템 간의 강한 연관성이 있다고 볼 수 있습니다.
This post is licensed under CC BY 4.0 by the author.