프로젝트 주제
2021년 따릉이 월별 대여이력 데이터를 바탕으로
① 서울 시민들의 '강남구청','강서구청' 대여소에서의 월별/시간대별 따릉이 대여 성향
② '강남구청', '강서구청'에서 따릉이를 대여한 후 가장 많이 반납하는 대여소 top 10
파악 후 지도 및 그래프 등으로 시각화
(데이터 출처 = http://data.seoul.go.kr/dataList/OA-15182/F/1/datasetView.do#, 서울시 열린 데이터 광장)
맡은 역할
1. 7월 및 8월 데이터에서 불필요한 columns 제거 후 대여 대여소가 '강남구청', '강서구청'인 데이터만 추출해 두 데이터(7월,8월)를 통합한 뒤 csv파일로 저장후 팀원에게 전달
https://colab.research.google.com/drive/1BiZwdZ2I9G925FaqCTwmdxTI4oTzSqIp#scrollTo=GfWVMtwulnzP
Google Colaboratory Notebook
Run, share, and edit Python notebooks
colab.research.google.com
2. 통합한 2021년 따릉이 대여이력 데이터를 바탕으로 월별/시간대별 따릉이 대여 성향 파악 및 그래프로 시각화
초본 - https://colab.research.google.com/drive/1DB0EJFt74oUOu4PQodUlsdgyvfLn_cYD
따릉이 그래프(초본).ipynb
Colaboratory notebook
colab.research.google.com
최종 - https://colab.research.google.com/drive/1Oe4R-VUb5X3_Sz1KOS71nBGNJbur43-6#scrollTo=AGhPBHIN1WZv
Google Colaboratory Notebook
Run, share, and edit Python notebooks
colab.research.google.com
- 그래프 시각화는 matplotlib,seaborn도 있지만 plotly를 이용하는 것이 코드의 간결성으로 보나 비주얼적인 면으로 보나 더 깔끔했다.
- 특히, matplotlib으로 할때는 한글이 깨져서 고생했지만 plotly는 그런 문제 없이 바로 깔끔하게 출력되서 편리했다.
- plotly는 딕셔너리를 베이스로 그래프를 출력하기 때문에 기껏 분류한 데이터를 다시 딕셔너리로 합쳐야 했던 점이 좀 귀찮았음.
- 이번 작업에서 가장 오래걸렸던 건 1년치 데이터를 월별로 추출하는 함수(month1, month2)를 정의하는 것 그리고 matplotlib과 plotly 둘 다 사용해 비교해보며 더 깔끔하고 편리한 방법을 찾는 것 (다음부터는 무조건 plotly..)
- 작업할 때는 확인차 실행했던 코드들 때문에 80셀 가까이 되었는데 이런 불필요한 코드를 지우고 알짜배기만 남기고 나니 정작 남은건 그 코드들의 28셀 인게 참으로 허탈..
- 그래프를 출력하다보면 DeprecationWarning이 길게 뜨면서 보기 불편한 경우가 있는데 이때, 해당 코드를 입력하면 출력되지 않음 (처음에 모든 코드 자동 실행했을 때는 Warning이 뜨지만 해당 코드를 다시 한번 실행시켜준뒤 그래프를 다시 출력하면 Warning이 안뜸)
import warnings
warnings.filterwarnings('ignore', category=DeprecationWarning) # Warning 안뜨게 하기
- plotly로 px 사용시 색깔 패턴 설정 참고 https://plotly.com/python/discrete-color/
Discrete
Over 13 examples of Discrete Colors including changing color, size, log axes, and more in Python.
plotly.com
'빅데이터 부트캠프 > 팀 프로젝트' 카테고리의 다른 글
마신사 프로젝트 1주차 (빅데이터 부트캠프 100~105일차) (0) | 2022.12.03 |
---|---|
웹페이지 페이징 및 파일 다운로드 구현 미니 프로젝트 (빅데이터 부트캠프 98~99일차) (0) | 2022.11.25 |
기본 웹페이지 구현 미니 프로젝트 (빅데이터 부트캠프 86~89일차) (0) | 2022.11.12 |
국내 기후변화 예산&의안 분석 프로젝트 (빅데이터 부트캠프 53~54&57~58&60~61일차) (0) | 2022.09.27 |
국내 기후변화 예산&의안 분석 프로젝트 진행 중 직면했던 문제 정리 (0) | 2022.09.21 |
댓글