SunKim Data

데이터 위클리 페이퍼 6 - 클러스터링, 고유값과 고유벡터, 히스토그램

데이터 간의 유사도를 계산할 때, feature의 수가 많다면(예: 100개 이상), 이러한 high-dimensional clustering 문제를 해결하기 위한 방법들을 설명해 주세요 데이터에 feature(변수)의 수가 많아지면, 데이터의 수가 차원의 수(변수)보다 적어져 데이터 내부의 노이즈가 증가하여 모델의 성능이 저하되고 데이터 간...

서울시 대중교통 개선 팀프로젝트10 - 보고서 제출

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출 오늘 할 일 코랩 데이터 취합 지표화 회의 보고서 정리후 결과물 제출 오늘 한 일 코랩 데이터 취합: 데이터 수집 부터 전처리, EDA, 지표화 분석 까지 하나로 취합 지표화 회의 : 회귀분석, 클...

서울시 대중교통 개선 팀프로젝트8 - EDA

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출 오늘 할 일 업무분장 : 자치구별 데이터결합 / EDA(지하철역별) / 보고서 및 발표자료 초안 데이터 분석하다가 문제 생기면 EDA팀은 데이터 결합 팀에게 전달 오늘 한 일 자치구별 데이터 결합 지하...

서울시 대중교통 개선 팀프로젝트7 - 데이터결합 및 EDA

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출 오늘 할 일 여러 데이터 합치기 EDA 시작 지표 점수화 오늘 한 일 여러 데이터 합치기: 전날 데이터 수집 및 전처리된 데이터 취합(지하철역별, 행정구별) 결합된 데이터 검증 : 팀원들이 작업한 ...