K폴드 교차 검증

1. 교차 검증의 필요성 머신 러닝 모델을 학습시킬 때 학습을 위한 학습 데이터, 그리고 예측 성능을 평가하기 위한 테스트 데이터가 있다. 그러나 이렇게 위의 방법은 과적합(Overfitting)의 위험이 있다. 과적합이란, 모델이 학습 데이터를 과도하고 학습하여 실제 데이터에 대해 오차가 증가하는 현상이다. 이로 인해 예측을 다른 데이터로 수행할 경우에는 예측 성능이 떨어지게 되는 것을 말한다. 이를 개선하기 위한 방법으로는 교차 검증이 있다. 교차검증은 학습 데이터를 다시 분할하여 학습 데이터와 학습된 모델의 성능을 일차 평가하는 검증데이터로 나눈다. 그리고 테스트 데이트 세트는 모든 학습/검증 과정이 완료된 후 최종적으로 성능을 평가하기 위한 데이터 세트이다. 수능을 예시로 들면 수능을 보기 위해 ..
야뤼송
'K폴드 교차 검증' 태그의 글 목록