본문 바로가기
2020/서울스마트캠퍼스

[서울 스마트 캠퍼스] - 도시문제 분석을 위한 데이터 시각화 및 탐색 과제

by 에이도 2020. 11. 3.

(2020.09.03)

도시문제 분석을 위한 데이터 시각화 및 탐색 (3차) 교육의 [과제1]을 진행하였다.

 

이 과제는 Power BI를 이용하여 서울시 공공 자전거(따릉이)의 데이터를 시각화한 결과물을 제작하는 것이다.

 

아래는 내가 제작한 데이터 시각화 과제 완성물이다.

좌측 부터

1. 날짜 - 슬라이서

2. 자치구 - 슬라이서

3. 이용자수 - 카드 유형

4. 대여소 수 - 카드 유형

5. 총 거치대 수 - 카드 유형

6. 대여소별 이용자 수 - 묶은 가로 막대형 차트

7. 대여일자별 이용자 수 - 꺾은선형 차트

8. 대여시간별 이용자 수 꺾은선형 차트

9. 자치구별 이용자수 구성 - 맵

 

총 9가지 데이터를 시각화 하였다.

 

크게 이용한 데이터는 총 자전거 수(이용자 수), 일자(date), 대여소 수와 거치대 수 등이 있다.

 

 

 

대여소에 따른 총 이용자수의 막대 그래프에서

각 대여소를 클릭하면 대여소의 자전거 거치대 수, 그 대여소의 일자 별 이용자 수, 시간 별 이용자 수, 그리고 위치 모두 변화하는걸 한 눈에 볼 수 있다.

 

일자별로 보면 2019년 12월 1일, 8일, 15일, 22일, 29일이 한 주에서 가장 낮은 날이다.

이 날은 일요일이다.

또한 각 일 자별로 따릉이 이용자 수가 가장 많은 시간도 오전 7-9시, 오후 17-19시 이다.

 

따라서 이 데이터를 얻을 수 있는 정보는 '평일 이용량이 많고, 이용 시간도 7-9시 , 17-19시 이용량이 많다' 이다.

 

이 정보를 가지고 추론 할 수 있는 것은

이 대여소들(홍대입구역 2번 출구, 마곡나루역 5번 출구)은 출근 시간때에 가장 많이 이용 된다는 정보를 알아낼 수 있다.

이 그래프를 통해서 알 수 있는 정보는 출, 퇴근 시간 따릉이 이용이 많다는 것이다.

 

 

 

 

12월 7일 - 12월 31일 강남구 따릉이 이용 데이터 분석해보자.

위에 차트와 대여시간 별 이용자 수가 새벽 0시- 2시 사용자가 생각보다 많음을 알 수 있다.

이는 강남에서 심야시간에도 유동인구가 있음을 알 수 있다.

 

 

Power BI를 통해서 따릉이 이용 정보를 정리하고 시각화하였다.

이를 통해 따릉이 이용 정보가 한 눈에 쉽게 파악이 된다.

또한, 새로운 정보를 객관적으로 전달할 수 있다.

 

앞으로 많은 데이터 분석과 시각화를 통해 정보를 이해하기 쉽게 제공하고 싶다.

 

 

댓글