본문 바로가기
개인 미니 프로젝트

갑자기 만든 국내 박스오피스 확인 파일

by Mecodata 2022. 10. 9.

평소에 영화에 관심이 많아 국내 박스오피스 순위를 자주 확인하는 습관이 있는데 이번 연휴에 갑자기 국내 박스오피스 순위를 확인하는 나만의 파일을 만들고 싶은 욕구가 생겨

영진위 오픈 API로 크롤링해서 테이블과 그래프를 확인하는 코드를 Python을 바탕으로 Pycharm을 이용하여 작성했지만 Pycharm으로는 뭔가 시각화가 별로로 느껴져

말로만 들었던 시각화가 좋은 tableau로 만들어보고자 시도했지만 아무 교육도 받지 않고 무작정 시도하다보니 시간이 생각보다 엄청 걸렸다..

도대체 하나의 파일에서 데이터를 여러 경우에 따라 필터링해서 적용하는 건 어떻게 해야하는건지.. 대시보드는 어떻게 꾸미고... 여러가지로 엄청해멨다.. 역시 프로그램을 배우지 않고 혼자서 무작정 사용해보는것은 참 무모한 짓같다..

이와중에 테이블로 시각화 할때는 f-string을 통해 끝에 '명'이라는 단어와 천단위 ,설정때문에 관객수 데이터를 string으로 사용해야했고

그래프로 시각화 할때는 string으로 하면 생성시 문제가 생겨 int로 바꿔줘야했기에 이 두가지 경우를 나눠서 코드를 짜야했던게 가장 큰 골칫거리였다..

그래도 다행히 어느 정도에 성공하여 Pycharm에 짜둔 코드로 데이터 업데이트한 뒤 tableau에도 데이터 새로고침을 해주면 바로 반영이 되어 평소에도 유용하게 잘 쓸수 있을듯하다 ㅎㅎ 

 

그나저나 포스터 이미지도 OPEN API로 불러올 수 있었으면 참 좋았을텐데 그렇지 못해 데이터 업데이트처럼 수동으로 다운받아서 교체해줘야 하는게 좀 아쉬움..

 

또, Tableau Public 파일로 보면 정상적으로 한국 시간에 맞게 데이터가 설정되는데 Tableau Public 홈페이지에 게시하면 외국 사이트라 그런지 UTC가 적용되어 한국 시간 기준 오전 9시가 지나야 결과가 반영이 되는데 이걸 어떻게 해결해야 하는지 모르겠음...


Tableau Public

https://public.tableau.com/views/_16654068229660/1?:language=ko-KR&:display_count=n&:origin=viz_share_link 

 

전일 기준 국내 박스오피스 순위

전일 기준 국내 박스오피스 순위

public.tableau.com


깃허브
https://github.com/anydevil0812/BoxOffice

 

GitHub - anydevil0812/BoxOffice

Contribute to anydevil0812/BoxOffice development by creating an account on GitHub.

github.com


이와중에 혹시나 태블로로 구현하는 것에 실패할까봐 코랩으로도 해놓은..
https://colab.research.google.com/drive/1aVM3qlTTk6fMJM1Ho1jZFWKYWg0wzq2t#scrollTo=agVGFv0HGv4B

 

Google Colaboratory Notebook

Run, share, and edit Python notebooks

colab.research.google.com

 

'개인 미니 프로젝트' 카테고리의 다른 글

자바 - MySQL 연동 미니 프로젝트  (0) 2022.10.22

댓글