본문 바로가기

캐글실습5

[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 - 자전거 수요예측/ 다양한 모델 사용해 상위 5%이내 점수 얻기 클론 실습 안녕하세요, [부스트코스] 캐글 실습으로 배우는 데이터 사이언스의 chapter 3 자전거 수요 예측의 마지막 강의인 다양한 모델 사용해 상위 5%이내 점수 얻기 실습내용 정리입니다! 강의 내용과 실제 코드 구현과 조금 차이가 있어 조금 수정하였습니다! www.boostcourse.org/ds116/lecture/57571 캐글 실습으로 배우는 데이터 사이언스 부스트코스 무료 강의 www.boostcourse.org 부스트코스 강의 링크입니다! 처음에는 필요한 모듈을 import하고, 쥬피터 노트북 안에서 그래프 이용과 ggplot 사용, 폰트 문제 해결 위해 추가적 설정까지 했습니다. import pandas as pd import numpy as np import matplotlib as mpl im.. 2020. 12. 24.
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 안녕하세요? 에이도입니다! 이 퀴즈는 저번에 챕터인 설문조사 분석과 시각화의 다음 챕터 CHAPTER 3. 자전거 수요 예측 Quiz 2 퀴즈 정답입니다!! 모두 밑에 정답 참고하셔서 부드러운 수강 진행 하시길 바랍니다 :) 감사합니다 :) 2020. 12. 24.
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 - 사이킷런 사이킷런을 함축해서 표현할 수 있는 표 (Cheat-Sheet)이다. 크게 4가지로 구분할 수 있다. 1) Classification (분류) 2) Regression (회귀) 3) clustering (군집화) 4) Dimensionality Reduction (차원 축소) 1) Classification은 분류하는 것으로써 시험에서 (합격 / 불합격) 혹은 점심을 (먹음 / 먹지 않음) (학생이다 / 학생이 아니다) 등을 측정하며 이용한다. 2) Regression은 회귀로써, x와 y값 선형관계를 파악하는 것이다. 독립변수(x값)데이터에 따라서 종속변수(y값)가 얼마나 변하는지에 대한 예측에 이용한다. 이 부스트코스 - 캐글 실습 캐글 실습으로 배우는 데이터 사이언스에서 실습하고있는 자전거 데이터 .. 2020. 11. 23.
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 - 자전거 수요량 예측 공유 자전거 수요량 예측(Bike Sharing Demand) 1. data set을 다운로드 받습니다! www.kaggle.com/c/bike-sharing-demand/data Bike Sharing Demand Forecast use of a city bikeshare system www.kaggle.com 2. 저는 Jupyter Notebook을 사용했습니다. 3. 문제 파악 : Regression (회귀)분석 모형입니다. 머신러닝의 지도 / 비지도 학습 중 지도 학습입니다. 왜냐하면, 특정상황에 따른 count가 존재하기 때문에 회귀(Regression)분석 문제입니다! (참고)쥬피터노트북에서 밑에 Shell을 추가할때, ESC + B 버튼을 누르면 밑에 Shell이 추가됩니다! 또한 위에 S.. 2020. 11. 3.
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 안녕하세요? 에이도입니다! 이번에 저는 부스트코스 - 캐글 실습으로 배우는 데이터 사이언스를 수강하고 있습니다! 부스트코스에서는 강의를 듣고, 퀴즈를 풀며 수강을 진행하는 포맷으로 진행되고 있는데요! 여기서 퀴즈가 가끔 헷갈려서 틀리는 경우가 많더라구요! 저도.. 몇 번 틀리고 하다보니.. 도움을 찾고자 하는 마음이 생기게 되어서 제가 이 퀴즈를 공유해보면 어떨까? 싶어서 퀴즈 정답을 공유하게 되었습니다! 이 퀴즈는 Quiz 1으로, 설문조사 분석과 시각화 강의의 퀴즈 정답입니다!! 모두 밑에 정답 참고하셔서 부드러운 수강 진행 하시길 바랄게요!! 제가 로또 프로젝트를 하면서 dataframe 값이 nan으로 나왔을 때, 어려움을 겪었었는데 그때 Nan을 어떻게 처리하나 고민고민하며 구글과 stackov.. 2020. 11. 3.