scikit-learn: machine learning in Python — scikit-learn 0.24.0 documentation
Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more...
scikit-learn.org
머신러닝에는 여러가지 기법이 있다.
머신러닝은 크게 지도학습과 비지도학습으로 구분할 수 있다.
지도학습은 Supervised Learning으로 입력값에 대한 정답이 있는 데이터를 통해 정답을 맞추는 기계학습 방법이다.
정답이 정해져있는(레이블 되어있는) 데이터(train_data)를 통해 학습한 모델을 통해 test data를 통해 예측을 해본다.
그리고 그 결과에 따라 모델을 평가할 수 있다.
비지도학습은Unsupervised Learning으로 입력값에 대한 정답이 없이 데이터를 통해 예측하는 기계학습 방법이다.
자동적으로 유사한 데이터를 Grouping한다.
ex) Clustering, 비슷한 고객들에게 프로모션 혹은 이벤트
지도학습
- Classification (분류) : 광고를 클릭할지/ 말지 (Yes or No)
Classification의 다양한 분류 모델
-이미지 레이블링
-이메일 스팸 필터
- 시험 점수 예측
비지도학습
- Regression(회귀) : 얼마를 구매할지, 광고의 얼마나 높은지 ( 특정 수치로 예측)
'Make the Learning Curve > 부스트코스' 카테고리의 다른 글
[부스트코스] 파이썬으로 시작하는 데이터 사이언스_Quiz 2 (0) | 2021.01.25 |
---|---|
[부스트코스] 파이썬으로 시작하는 데이터 사이언스 / Quiz 1 (0) | 2021.01.18 |
[부스트코스] Kaggle 실습으로 배우는 데이터 사이언스 수료 (0) | 2020.12.24 |
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 - 자전거 수요예측/ 다양한 모델 사용해 상위 5%이내 점수 얻기 클론 실습 (0) | 2020.12.24 |
[부스트코스] 캐글 실습으로 배우는 데이터 사이언스 (0) | 2020.12.24 |
댓글