공유오피스 출입데이터 분석 팀프로젝트7 - 보고서 초안 작성
최종 분석 주제 : 공유오피스 무료 체험 유저의 유료 결제 전환 예측 및 데이터 수집 전략 제안
오늘 할 일
- 보고서 초안 작성하기(계속)
- 분석 배경 보완
- 팀원 보고서 정리
오늘 한 일
- 보고서 초안 작성하기
내일 할 일
- 보고서 완성 및 제출
- 보고서 초안 점검
- 모델 분석 내용 보완하기
- 어색한 내용 보완하기(5번~7번)
- 그림, 표 캡션달기
- 제출 전 보고서 최종 점검하기
Issues & Challenges
분석 배경 만들기
- 월별 무료체험 유저수는 유사한 패턴을 가지고 있으나, 최신년도에서 유료 결제 전환 유저 비율이 감소하고 있는 것으로 관찰됨
보고서 초안 작성 완료 : 목차
- 분석 배경 및 목적
- 데이터 전처리 2-1. 데이터 소개 2-2. 테이블 설명 2-3. 데이터 전처리
- EDA(탐색적 데이터 분석) 3-1. 히스토그램 및 박스 플롯 분석 3-2. 재실시간 분석 3-3. 첫 방문 날짜 분석 3-4. 방문 요일 분석 3-5. 무료 체험 신청일과 첫 방문일 간 차이 분석 3-6. 입실/퇴실 빈도 분석 3-7. 지점 분석 3-8. 결제 여부에 따른 그룹 간 차이 분석 3-9. 결제 전환율과 각 변수 간의 상관관계 분석
- 모델 분석 4-1. 로지스틱 회귀 4-2. 랜덤 포레스트 4-3. LGBM 4-4. Catboost 4-5. SMOTE+ENN 적용 Catboost 4-6. XGboost 4-7. Smote+Enn 적용 XGboost 4-8. 모델 성능 요약
- 한계점 5-1. 모델 성능 해석 5-2. 데이터 부족 원인 분석
- 데이터 수집 전략 및 비즈니스 개선 방향 제안 6-1. 데이터 수집 전략 제안 6-2. 비즈니스 개선 방향 제안
- 결론 및 기대효과
내일 할 일
- 보고서 초안 점검
- 모델 분석 내용 보완하기
- 어색한 내용 보완하기(5번~7번)
- 그림, 표 캡션달기
- 제출 전 보고서 최종 점검하기
Reflection
- 데이터의 한계는 있었지만 보고서 초안은 완성했다. 전체적으로 프로젝트 퀄리티도 아쉽고 보고서와 모델링 결과도 아쉽다. 시간을 더 투자할수록 완성도는 점점 추상적으로 바뀌고 있다. 그래서 적당히 타협해서 프로젝트를 마무리할 예정이다. 이번 프로젝트와 강사님과 멘토님의 현업 경험담을 들어보면 로그설계를 작성하거나 분석해본 경험이 데이터분석가의 숨은 경쟁력이 될 수 있다고 확신한다. 시작이 반이고 시작을 잘해야 한다.
This post is licensed under CC BY 4.0 by the author.