본문 바로가기
Make the Learning Curve/부스트코스

[부스트코스] 프로젝트로 배우는 데이터사이언스 / 사이킷-런(scikit-learn) - Machine Learning in Python

by 에이도 2021. 1. 18.

scikit-learn.org/stable/

 

scikit-learn: machine learning in Python — scikit-learn 0.24.0 documentation

Model selection Comparing, validating and choosing parameters and models. Applications: Improved accuracy via parameter tuning Algorithms: grid search, cross validation, metrics, and more...

scikit-learn.org

 

머신러닝에는 여러가지 기법이 있다.

https://scikit-learn.org/stable/

머신러닝은 크게 지도학습비지도학습으로 구분할 수 있다.


 

지도학습Supervised Learning으로 입력값에 대한 정답이 있는 데이터를 통해 정답을 맞추는 기계학습 방법이다.
정답이 정해져있는(레이블 되어있는) 데이터(train_data)를 통해 학습한 모델을 통해 test data를 통해 예측을 해본다.
그리고 그 결과에 따라 모델을 평가할 수 있다.  

 

비지도학습Unsupervised Learning으로 입력값에 대한 정답이 없이 데이터를 통해 예측하는 기계학습 방법이다.
자동적으로 유사한 데이터를 Grouping한다.
ex) Clustering, 비슷한 고객들에게 프로모션 혹은 이벤트   


지도학습

- Classification (분류) : 광고를 클릭할지/ 말지 (Yes or No) 

https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html

Classification의 다양한 분류 모델

-이미지 레이블링

-이메일 스팸 필터

- 시험 점수 예측

 

비지도학습

- Regression(회귀) : 얼마를 구매할지, 광고의 얼마나 높은지 ( 특정 수치로 예측) 

 

 

댓글