ML/사이킷런

사이킷런에서는 여러 예제를 제공하고 있는데 그 중 많이 사용되는 것이 붓꽃 데이터를 이용하여 품종을 분류할 수 있다. 붓꽃 데이터 세트에서 꽃잎의 길이와 너비, 꽃받침의 길이와 너비 4개의 feature를 기반으로 품종을 예측할 수 있다. 1. 붓꽃 품종 예측 프로세스 데이터 세트 분리 : 데이터를 학습 데이터와 테스트 데이터로 분리 모델 학습 : 학습 데이터를 기반으로 ML 알고리즘을 적용하여 모델 학습 예측 수행 : 학습된 ML 모델을 이용해 텟흐트 데이터의 분류를 예측 평가 : 이렇게 예측된 결과값과 테스트 데이터의 실제 결과값을 비교하여 ML 모델의 성능을 평가 2. 실습 - 데이터 세트 분리 제공되는 붓꽃 데이터는 다음과 같이 구성되어 있다. 타켓 데이터 : setosa, versicolor, ..
1. 사이키런이란? 파이썬 기반에서 머신러닝 분석을 위해 사용할 수 있는 라이브러리이다. 머신러닝을 위한 다양한 알고리즘과 개발을 위한 편리한 프레임워크, 그리고 API를 제공한다. 주로 Numpy와 Scipy 기반 위에서 구축된 라이브러리 오랜 기간 실전 환경에서 검증되었다. 2. fit()과 predict() 사이킷런은 분류(Classifiacation)와 회귀(regression)의 다양한 알고리즘을 fit()과 predict() 함수로 간단하게 학습과 예측을 할 수 있다. ML 모델 학습을 위해서 fit() 함수를 사용하고, 학습된 모델의 예측을 위해서는 predict() 함수를 사용한다. 분류 알고리즘으로는 Classifier, 회귀 알고리즘으로는 Regressor로 지칭하고 이 2개를 합쳐서 ..
야뤼송
'ML/사이킷런' 카테고리의 글 목록 (2 Page)