앞서 stage3에 들어가면서, 가지고 있는 데이터를 training set, validation set, test set으로 나눴습니다.
하지만 test set은 전혀 사용한적이 없었습니다.
여러 모델을 만들고, training set으로 학습시킨 후 validation set으로 성능을 측정하였을 뿐입니다.
지금부터 할일은 stage3에서 가장 성능이 좋았던 모델을 하나 골라 training set과 validation set을 합한 데이터로 학습 시킨 후, test set으로 모델의 최종성능을 평가하는 것입니다.
[단계1] Stage3 파일을 복사한 후 실행합니다. (파일이름은 homework1로 설정합니다)
[단계2] 모든 데이터를 8:2로 나누어 training set과 test set으로 만듭니다. 이 때 training set을 다시 나누어 validation set을 만드는 작업은 하지 않습니다.
[단계3] 선정한 모델을 test set을 이용해 최종 성능을 평가합니다.
최종 모델의 성능 스코어 [ ]
이제 코딩을 시작하세요! 코딩이 끝나면 모범답안과 비교해보세요.