24년 9월 회고
데이터분석가로 커리어전환을 위해 국비지원 데이터분석 7개월과정을 신청했습니다.
데이터분석 공부를 시작한지 1개월이 지난시점 그동안 어떤일들이 있었는지 되돌아보는 시간을 갖고자합니다.
Liked : 좋았던 점
약 2주동안 첫 팀프로젝트를 성공적으로 완료했습니다. 프로젝트를 진행하면서 여러 문제들이 발생했지만, 언제나 팀원들과 함께 해결했던 점이 긍정적으로 작용하여 우리팀이 분석주제를 프로젝트 진행중에 몇차례 바꿨음에도 불구하고 다같이 진행을해서 팀원들이 끝까지 참여하고 원하는 결과를 만들어냈던것 같습니다.
프로젝트 단위마다 파트가 나뉘어지는데요, 파트2로 바뀌면서 배우는 내용들이 어려워서 너무힘들었지만, 그 과정속에서 분석 실습을 했을때 어느정도 몰입할 수 있는 재미를 찾은것 같아서 좋았습니다. 클러스터링이나 차원축소 등 생소한 내용들을 코딩했을때 생각보다 분석 결과가 해석하기 쉽게 나온 데이터들도 있었고, 시각화 과정을 배우면서 차트를 좀 더 보기쉽고 원하는 느낌으로 커스터마이징 하는과정이 흥미로웠습니다. 장바구니 분석또한 제가 실제로 경험했던 도메인지식과 관련된 주제로 실습을 진행해서 좀 더 편하게 배우고 실습에 적용할 수 있었습니다. 커리큘럼에 어려움이 있음에도 불구하고 몰입할 수 있는 재미를 느낀다는것이 이 과정을 끝까지 진행할 수 있는 하나의 긍정적인 요소를 찾을 수 있어 좋았습니다.
Lacked : 아쉬웠던 점, 부족한 점
프로젝트를 하면서 아쉬웠던 점도 빠질 수 없죠. 분석주제를 몇차례 바꾸면서 일정관리가 많이 꼬였고 2주라는 기간중에 첫째 주는 주제선정에만 시간을 전부 사용했습니다. 그렇기에 다른팀들은 데이터 전처리도하고 EDA까지 진행중인데 막막한 느낌도 들기도했지만, 주제의 흐름이 큰틀에서는 바뀌지 않았고 디테일한 수정만 있고 자료자체는 이미 수집된 상황이기 때문에 크게 걱정하진 않았습니다. 그래도 프로젝트를 끝난시점에 되돌아보면 첫째 주를 조금더 효율적으로 사용했으면하는 아쉬움이 있었습니다. 향후에 팀 프로젝트를 진행하게된다면 팀의 분위기를 사전에 파악하여 적절한 일정관리를 할 필요성을 느꼈습니다. 프로젝트가 끝나면서 팀원이 바뀌고 제가 팀장이 되었는데요, 저번 프로젝트에서 느꼈던 점들을 잘보완해서 진행할 기회를 얻은 것 같습니다. 그리고 팀 프로젝트 코딩내용을 취합하는 담당을 맡았는데, 저희팀은 시작부터 데이터를 취합하지 않았고 각자 작업한뒤 기존 작업물에 각자 합쳐서 최종본이 나왔습니다. 그래서 프로젝트 전체 코딩파일이 따로있지않아 작업물 제출시점에 최종 전처리작업과 분석과정이 있는 코드를 역으로 추적하여 처음부터 다시 만들었는데요, 굉장히 힘들었습니다. 제가했던 작업물조차도 최종물을 기반으로 초기코드들을 작성하는데 어려움이 많았는데, 팀원들의 코드를 파악하여 처음부터 만드는것또한 쉽지않았습니다. 결국 일을 두번하면서 시간을 많이소비했는데요, 다음 프로젝트에서는 불필요한 작업을 줄일수있도록 코딩작업을 처음부터 팀원들과 관리하는 프로세스를 구축할 필요를 느꼈습니다.
파트2로 넘어오면서 클러스터링과 차원축소 등 다양한 기법들을 배우고있는데, 그과정에서 지식을 받아들이는 속도가 너무 느려서 어려움이 많았습니다. 커리큘럼이 빡빡하여 이론을 배우는과정은 짧은데 실습난이도는 이론보다 어려웠고 배운내용이 정리가 되지않은상황에서 빠르게 진행됐기때문에 이번달은 과제를 수행하는데 어려움이 많았습니다. 그래서 GPT 등 AI에 의존하게되는 상황이 많이 발생됐고 그런 부분들이 제가 데이터분석을 제대로 공부하고있는지 의구심이 들수밖에 없었습니다. 이런부분들을 멘토님이나 강사님, 같이 공부하는 수강생분들과 이야기도 나눠보고 상담도 받아보면서 커리큘럼을 짧은시간에 전부 이해하는건 당연한 어려움이 있는것이고 적당한 긴장감을 가지고 조금은 가벼운 마음으로 반복해서 숙달하는 과정을 거치는 과정으로 긍정적인 마인드 전환을 했습니다. 그러다보니 조금은 더 편하게 공부를 할수있었고 몰입할 수 있는 환경들이 조성되지 않았나 생각합니다. 앞으로의 과정들도 쉽지않겠지만 혼자서 해결하려하지말고 동료들의 도움을받아 끝까지 완수할 수 있도록 노력해야겠습니다.
Learned : 배운 점
- 첫 팀프로젝트 완료 : 처음으로 팀활동을 진행하며 개선해야하는 문제들과 유지해야할 행동들을 확인할 수 있었고, 결과물이 성공적으로 마무리되어 뿌듯합니다.
- 클러스터와 차원 축소 : 이론시간이 너무짧았고 이전에배운 통계적 지식들이 정리가 되지않은상태에서 어려움이 많아 추가적인 복습시간을 많이 투자했습니다. 그럼에도 불구하고 아직까지 클러스터링과 차원축소는 어려운것같습니다. 기초통계 지식들도 다시 공부하고있습니다.
- Python으로 하는 데이터 시각화 : fig와 ax변수를 두고 subplots 함수를 이용한 다양한 시각화 방법과 State-based와 Object-oriented 인터페이스 관점에서 시각화 하는 방안을 확인할 수 있었습니다. 이과정에서 차트를 좀더 자유롭게 커스터마이징 할수있고 보기좋게 시각화하는 방법을 배울수있었습니다.
- 장바구니 분석(연관분석) : 상품 간 연관성을 확인하는 기법들을 배웠고, 연관성을 네트워크 그래프로 시각화하는 부분도 습득했습니다.
- 분석 보고서 작성 :
- 신용카드 데이터 python 시각화 : 고객의 사용 패턴을 분석하여 몇개의 그룹으로 세분화하고, 각 그룹에 맞는 마케팅 전략 수립
- 베이커리 구매 데이터 연관분석(장바구니 분석) : 베이커리 고객의 구매 패턴을 분석하여 상품 간의 연관 규칙 파악 및 마케팅 전략 수립
Longed for : 앞으로 바라는 것
- 커리큘럼이 진행될수록 어려움이 많았는데, 조금은 가벼운 마음으로 긍정적인 시각으로 접근할 필요를 느꼈습니다. 그리고 분석 실습을 진행하면서 흥미로운 부분들이 발견되고있어, 반복적인 학습을위해 관심있는 데이터들을 찾아 분석을 진행해볼 생각입니다. 이번에 팀원이 바뀌면서 데이콘에 참여해보자는 의견이나와 새로운 경험을 해볼생각입니다.