서울시 대중교통 개선 팀프로젝트11 - 팀프로젝트 발표
- 서울시 대중교통 개선 팀프로젝트10 - 보고서 제출
- 서울시 대중교통 개선 팀프로젝트9 - 지표화 및 작업물 취합
- 서울시 대중교통 개선 팀프로젝트8 - EDA
- 서울시 대중교통 개선 팀프로젝트7 - 데이터결합 및 EDA
- 서울시 대중교통 개선 팀프로젝트6 - 주제확정 및 데이터전처리
- 서울시 대중교통 개선 팀프로젝트5 - 방향정리
- 서울시 대중교통 개선 팀프로젝트4 - 배경 재논의 및 데이터수집
- 서울시 대중교통 개선 팀프로젝트3 - 역할세분화 및 배경조사와 데이터수집
- 서울시 대중교통 개선 팀프로젝트2 - 주제선정
- 서울시 대중교통 개선 팀프로젝트1 - 주제탐색
최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출
오늘 할 일
- 팀프로젝트 발표
오늘 한 일
- 팀프로젝트 발표 : EDA와 전처리 진행과정을 맡아 발표 진행
내일 할 일
- 수업 들어야겠지…?
Reflection
- 팀프로젝트 발표 : EDA 및 전처리 진행과정을 맡아 발표 진행
- 최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출
- PPT발표를 분석배경 1명 / EDA 및 전처리 1명 / 데이터 분석 2명 / 결론과 후속과제 1명 분류
- 맡은 영역당 4분의 발표 스크립트 작성후 발표 진행
- 발표날 새벽까지 각자 배분된 영역에서 스크립트를 만들고 그 과정에서 PPT를 수정 또 수정…
- 총 13장 분량을 4분이내 (장당 18초~19초) 진행하기위해 스크립트를 압축 또 압축…
- 팀발표는 성공적으로 팀원이 적절하게 발표를 진행했고 좋은평가를 받았다!
- 시선을끄는 PPT 제목과 디자인, 그리고 아무도하지못한 대시보드 결과물이 주목받았다!
- 전체적으로 발표 구성이 매끄럽고 깔끔하게 진행되어 팀원들이 만족했다.
- PPT자료 일부
- 시선을끄는 제목!
- 두 차례 분석주제 변경 : 데이터 수집이 어렵거나 분석의 어려움이 있어 몇차례 분석주제를 바꿨고, 분석주제를 바꾸는 결정을 하는시간이 많이 소요됐다. 다행히도 큰틀에서는 우리가 지금까지 수집한데이터들을 활용할수있었지만, 차기 프로젝트에서는 조금더 빠른판단을 할수있도록 진행을 해봐야겠다.
- 활용 데이터 : 기재된 데이터 뿐만아니라 30여가지의 데이터를 수집하고 결합하고 제외하는 과정들을 거쳐 하나의 데이터로 결합되었다. 그과정에서 단순히 정제된 데이터를 가공하기도하고, api를 이용하여 데이터를 만들어보기도 하고, 위도와 경도 정보를 매핑하여 지도로 시각화하거나 인근거리 데이터정보를 수집하기도 했다. 개발자 전공 출신의 하드스킬이 단단한 팀원이 있어 파이썬 기반으로 우리가만든 지표들을 대시보드로 만들어 보여줄 수 있었다.
- 결측치 처리내역 : 이번 분석을통해 같은역 이용객 집계가 한곳으로 되는역들을 발견했다.
- 가설설정 : 노인친화적인 지하철역을 조성하기위한 가설설정
- 다양한 분석시도 : 지표 수립을 위해 우리가 배우지 않은 클러스터링 방법을 도입해봤으나, 타당성이 부족하다고 판단하여 보류되었다. 지표화하는과정에도 꽤많은 시간을 공들여서 시도해봤다. 클러스터링 뿐만아니라 정규화방식, 가중치방식 등 다양한 방식으로 지표 수립을 논의하였다.
- 회귀분석 지표화 : 지표를 수립하는데 다양한 방식이 논의되었고, 회귀분석 결과를 바탕으로 지표를 수립하였다. 우리가 모델링도 도입하고 클러스터링 등 배우지않은 지식을 사용했지만, 명확하게 기준을 정할수가없었고, 또한 시청하는 수강생입장에서도 배우지않은 지식을 설명드리기에 전달에 어려움이 있다고판단하여, 최대한 우리가 알고있는 지식에 한하여 분석을 진행하도록 선회하였다.
- 결과물 시각화 : 지표화된 결과를 능력자 팀원 덕분에 대시보드로 시각화 할 수 있었다.
- 활용 방안 제안 : 비록 이번 데이터분석에서는 단순히 회귀분석을 통해 점수를 부여했지만, 모델링 등 데이터분석 학습후 조금더 여유있는 시간과 양질의 데이터를 결합하여 다듬는 시간이 주어진다면 팀원들과 내용을 정리해보고 실질적으로 유관기관에 제언을 해본다면 유의미한 경험이 될수있지않을까 생각이들고, 시간이지나고 팀원들이랑 논의를 해봐야겠다.
- 번외 : 이번 프로젝트를 진행하면서 작업한 자료들… 아마 노션과 코랩을 포함하면 2배는 되지않을까… 팀원들도 고생이 상당했다.
- 팀프로젝트 회고(KPT)
- Keep : 프로젝트 일정과 문제점을 언제나 팀원들과 함께 해결했던 점이 중요하다고 판단했고, 결과적으로 우리가 분석주제를 몇차례 변경했어도 다같이 진행을 하기때문에 팀원들이 끝까지 참여할수있지 않았나싶다.
- Problem : 앞서 말했지만 분석주제를 몇차례 바꾸면서 첫째주 일정관리가 어려웠고, 이번 프로젝트를 통해 조금더 원활한 진행방식을 유도할 수 있을것같다. 팀원들이 선하다보니 자신들이 작업한 자료와 팀원이 작업한 자료들의 노력이 헛되지않도록 섣불리 한쪽으로 결정을하는데 주저하는 시간이 오래걸렸다. 그래도 어느정도 노선을 잡은뒤로는 조금더 빠른 결단을 하는 팀원들의 모습을보니 성향이 비슷해 극복해낸것같다. 향후에 팀 프로젝트를 진행할때, 팀의 분위기를 살펴 적절한 일정조율을 제시할 필요가있다. 결국에는 사람을 잘파악해서 다루는 능력이 필요하다.
- Problem2 : 우리가 작업한 코딩을 각자 진행했는데, 최종 결과물에는 하나의 코딩파일로 제출해야하기에 뒤늦게 취합을 맡아서 진행했는데 굉장한 어려움이 있었다. 내 작업물조차도 코딩시 사용된 데이터들이 중간에 생략된부분이 많아 복원하는데 어려움이 많았다. 다행히도 팀원들이 나름 기준을 가지고 코딩을 정리해놨기때문에 불가능하진 않았다. 그래도 이번 프로젝트가 초급프로젝트이고 분량이 적기에 취합이 가능하지 않았나싶다. 다음 프로젝트에서는 반드시 처음부터 취합하여 버전을 관리하는 프로세스를 구축해야겠다.
- Try : 이번 분석을 진행하면서 중간에 데이터가 부족하거나 시간이나 지식이 부족하여 포기한 주제들이 다수있다. 보류된 주제들을 모델링학습후에 다시분석해보고싶고, 나아가 팀원들이랑 분석했던 주제들도 다듬어서 공모전으로 참여해보고싶다.
This post is licensed under CC BY 4.0 by the author.