Post

서울시 대중교통 개선 팀프로젝트8 - EDA

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출

오늘 할 일

  • 업무분장 : 자치구별 데이터결합 / EDA(지하철역별) / 보고서 및 발표자료 초안
  • 데이터 분석하다가 문제 생기면 EDA팀은 데이터 결합 팀에게 전달

오늘 한 일

  1. 자치구별 데이터 결합
  2. 지하철역별 EDA분석 + 지표화 고민
  3. 코랩 데이터 취합

내일 할 일

  • 팀원별 맡은업무 집중!
  • 보고서 : 온
  • 코랩 데이터 취합 : 선혁
  • 가설(설정, 검정) 및 지표화 : 성혁, 유진

Issues & Challenges

  • 업무분장 : 자치구별 데이터결합 / EDA / 보고서 및 발표자료 초안
    • 자치구별 데이터결합 : 결합은 했지만 지하철역 별 관련 데이터 지표를 우선적으로 선정하기로 결정하고 EDA진행

    자치구별 데이터결합

  • 지하철역별 안전사고와 연단정보(승강장이격거리), 높이차 EDA분석
    • 요약 : 연단간격이 넓은 지하철역이 안전사고 발생횟수가 상위권으로 관찰됨
    • 최근5년 안전사고 2,239건 중 1,542건(69%)이 열차관련 사고(출입문, 발빠짐, 열차내사고)
    • 지하철역별 승강장 연단간격이 넓음수 : 10개이상 발생된곳은 22개역

지하철역별 연단간격넓음수

  • 지하철역별 높이차 높음수 : 10개이상 발생된곳은 13개역(을지로입구와 영등포구청역이 너무튐)

    지하철역별 승강장 높이차 높음수

  • 지하철역별 연단간격넓음+높이차높음 수 : 20개이상 발생된곳은 17개역

    지하철역별 승강장 연단간격+높이차 수

  • 지하철역별 최근5년 안전사고 발생횟수 : 연단간격이 넓은 지하철역이 실제 사고발생과 연관성이 높은것으로 관찰됨
    • 연단간격과 높이차와 상관없는 상위10개 안전사고 발생역은? : 신도림, 사당, 구디 등
    • 연단간격과 높이차는 안전수치이고, (추측)사람이 많이승/하차 하는게 요인일듯
    • → 승강장 연단간격이 넓거나 사람이 많이다니는곳이면 사고가 발생할것

      지하철역별 최근5년 안전사고 발생횟수와 승강장관련변수

  • 지하철역 관련 상관관계 분석(승하차인원과 종속변수들)
    • 승하차인원이 높은역에 시장과 노인선호시설, 안전사고 발생이 양의 상관관계
    • 편의성(엘리베이터, 에스컬레이터 등)은 상관관계가없다? 내리는 인원대비 부실한 시설?

상관관계분석1

상관관계분석2

  • 데이터 추가결합 후 결측치 처리
    • 9호선 자료가 없는 데이터가 많고 자료가부족한 3개역 제거, 주변시설 분류해서 추가
    • 결측치제거 : 9호선역 13개, 신내, 연신내, 충무로
    • 삭제컬럼 : ‘역주변노인선호시설수’
    • 추가컬럼 : 역주변노인선호 : (‘공원’, ‘행정시설’, ‘의료시설’, ‘복지시설’, ‘종교시설’)
  • 팀회의 : 오후1시, 4시, 6시, 멘토링9시~11시 진행
    • 1시 : EDA 1차 토론 (+지표화 고민)
      • 등급화 : 서울역 안전 3점, 여가시설 2점, 접근성 4점 → 몇등급
        • 등급이 높은곳이 하차인원이 많아야 할 것이다
      • 각자 지표화 점수 만들어보기
    • 4시 : 팀원별 상관관계 분석 및 지표화를 어떻게 해야할지 공유중인데 명확하지않음
      • 지표화 할 변수들
        • 위험도(안전사고 발생 횟수)
        • 지하철 안전시설(엘레베이터, 에스켈레이터, 휠체어 리프트)
        • 선호시설(종교시설, 공원, 복지시설, 시장)
        • 의료시설(의료시설)
      • 안전 지표와 접근성 지표의 변수들과 종속 변수 간의 관계 가설 설정 및 가설 검정
    • 6시 회의 : EDA공유, 남은 일정 업무 분배
      • 보고서 : 온
      • 코랩 : 선혁
      • 가설(설정, 검정) 및 지표화 : 성혁, 유진
    • 9시 회의(멘토링) : 멘토님과 지표화에 대한 고민, 모델 도입까지 고려중…
      • 다양한 모델링 이야기가 나오는데… 모델링을 쓰는 이유와 결과값만 이해하고있는중… 모델링을 따로배우지않아 어렵다.

Reflection

  • 지하철역별 노인승하차인원에 따라 안전성, 접근성 지표를 만드는데 난항을 겪고있다. 아무래도 따로 지표화 가이드라인이 없고 팀원들의 주관적인 판단을 근거로 만들어서 지표를 만드는데 확신이 안들어 결정을 못하고있다. 멘토링을 통해 어느정도 지표화에 대한 고민을 줄일수있었고 일단은 복잡하게 생각하는것보단 논리에 근거하여 만드는것으로 접근하고자 한다. 그리고 코랩 데이터를 취합을 담당했는데 팀원들이 각자 작업을하고 이것을 합치는데 시간적인 노력이 많이 필요할것같다. 우리가 각자 작업하기전에 깃허브나 아니면 한명이 취합하는방향으로 생각도했는데, 그때 좀 더 고민했다면 어땠을까하는 아쉬움이있지만 파이썬 공부하는 느낌으로 긍정적으로 생각하고자한다!
This post is licensed under CC BY 4.0 by the author.