파이썬 데이터분석 데이터시각화1

!pip install koreanize-matplotlib import koreanize_matplotlib import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt Collecting koreanize-matplotlib Downlo...

Sep 24, 2024 Data_analysis, Python_DA_Library

파이썬 데이터분석 클러스터와 차원축소 실습

### 개발환경 세팅하기 # ▶ 한글 폰트 다운로드 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf Reading package lists... Done Building dependency tree... Done Reading state info...

Sep 23, 2024 Data_analysis, Python_DA_Library

파이썬 데이터분석 클러스터와 차원축소2

import pandas as pd from sklearn.cluster import KMeans import seaborn as sns pd.options.display.float_format = '{:,.2f}'.format sales_df = pd.read_csv('/content/drive/MyDrive/sales_data.csv', ind...

Sep 22, 2024 Data_analysis, Python_DA_Library

데이터 위클리 페이퍼 6 - 클러스터링, 고유값과 고유벡터, 히스토그램

데이터 간의 유사도를 계산할 때, feature의 수가 많다면(예: 100개 이상), 이러한 high-dimensional clustering 문제를 해결하기 위한 방법들을 설명해 주세요 데이터에 feature(변수)의 수가 많아지면, 데이터의 수가 차원의 수(변수)보다 적어져 데이터 내부의 노이즈가 증가하여 모델의 성능이 저하되고 데이터 간...

Sep 20, 2024 Data_analysis, Weekly

파이썬 데이터분석 클러스터와 차원축소

클러스터링 연습 클러스터 예제 1 import pandas as pd user_activity = pd.read_csv('/content/drive/MyDrive/app_users.csv', encoding='utf-8-sig', index_col=[0]) user_activity.head() ...

Sep 13, 2024 Data_analysis, Python_DA_Library

서울시 대중교통 개선 팀프로젝트11 - 팀프로젝트 발표

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출 오늘 할 일 팀프로젝트 발표 오늘 한 일 팀프로젝트 발표 : EDA와 전처리 진행과정을 맡아 발표 진행 내일 할 일 수업 들어야겠지…? Reflection 팀프로젝트 발표 : EDA ...

Sep 10, 2024 Data_analysis, Team_project1

서울시 대중교통 개선 팀프로젝트10 - 보고서 제출

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출 오늘 할 일 코랩 데이터 취합 지표화 회의 보고서 정리후 결과물 제출 오늘 한 일 코랩 데이터 취합: 데이터 수집 부터 전처리, EDA, 지표화 분석 까지 하나로 취합 지표화 회의 : 회귀분석, 클...

Sep 9, 2024 Data_analysis, Team_project1

서울시 대중교통 개선 팀프로젝트9 - 지표화 및 작업물 취합

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출 오늘 할 일 팀원별 맡은업무 집중! 보고서 : 온 코랩 데이터 취합 : 선혁 가설(설정, 검정) 및 지표화 : 성혁, 유진 사과따기 : 성학 오늘 한...

Sep 7, 2024 Data_analysis, Team_project1

서울시 대중교통 개선 팀프로젝트8 - EDA

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출 오늘 할 일 업무분장 : 자치구별 데이터결합 / EDA(지하철역별) / 보고서 및 발표자료 초안 데이터 분석하다가 문제 생기면 EDA팀은 데이터 결합 팀에게 전달 오늘 한 일 자치구별 데이터 결합 지하...

Sep 5, 2024 Data_analysis, Team_project1

서울시 대중교통 개선 팀프로젝트7 - 데이터결합 및 EDA

최종 분석 주제 : 서울교통공사가 운영하는 지하철역들의 노인 이용 패턴과 접근성, 위험도 분석 후 지표화 및 개선사항 도출 오늘 할 일 여러 데이터 합치기 EDA 시작 지표 점수화 오늘 한 일 여러 데이터 합치기: 전날 데이터 수집 및 전처리된 데이터 취합(지하철역별, 행정구별) 결합된 데이터 검증 : 팀원들이 작업한 ...