Bike 데이터 셋을 활용한 데이터 처리 및 시각화

학습 목표

학습 내용

대회 소개

(실습1) 데이터를 알아가기 위한 여러가지 질문을 작성해 보자.

01. 데이터 날짜는 언제부터 언제까지 데이터일까?

02. 실제 빌린 대수(count)와 다른 정보간의 관계는 어떤 관계가 있을까?

03. count와 다른 변수간의 관계 확인 - corr() 상관계수

04. 계절별 데이터는 어떤 패턴을 가질까?

05. 쉬는날과 쉬는 날이 아닌 데이터는 어떤 패턴을 가질까?

06. weather는 어떤 값을 갖고, 각각의 데이터의 수는 얼마나 될까?

06. 아래의 값의 분포를 2행, 2열로 표시해 보자.

07. 여러 특징(피처)의 값들의 분포는 어떠할까?

01. 데이터 날짜는 언제부터 언제까지 데이터일까?

2. 실제 빌린 대수(count)와 다른 정보간의 관계는 어떤 관계가 있을까?

seaborn 활용

03. count와 다른 변수간의 관계 확인 - corr() 상관계수

막대 그래프로 시각화 해보기

04. 계절별 데이터는 어떤 패턴을 가질까?

(생각해보기) 계절별 count의 총합은 얼마나 될까?

05. 쉬는날과 쉬는 날이 아닌 데이터는 어떤 패턴을 가질까?

(생각해보기) 0과 1의 각각의 데이터를 boxplot로 표현할 수 있을까?

06. weather는 어떤 값을 갖고, 각각의 데이터의 수는 얼마나 될까?

07. 여러 특징(피처)의 값들의 분포는 어떠할까?

08. weather별 데이터의 비율은 어느정도 될까?