데이터 사이언스 LV1 입문
현장 강의
Search…
데이터 사이언스 LV1 입문
사전 준비
1주차 - 데이터 사이언스 마인드
2주차 - 딱 데이터 사이언스를 위한 파이썬
3주차 - Decision Tree로 타이타닉 생존자 찾기
4주차 - Random Forest로 아이리스 종 구분하기
5주차 - 회귀분석으로 집 값 예측하기
Solution - 모범 답안
Stage1 - Linear Regression을 배워보자
Stage2 - Visualization 연습하기
Challenge1 - Polynomial Linear Regression
Stage3 - Scikit-learn으로 Linear Regression 구현하기
Stage4 - Feature Scaling과 성능 개선
Challenge2 - Feature Scaling을 적용한 데이터의 Visualization
과제1 - Test 진행하기
과제2 - Linear Regression으로 타이타닉 생존자 예측해보기
6주차 - LV1 데이터 사이언티스트 되기
나아가기
코딩좀알려주라
Powered By
GitBook
과제1 - Test 진행하기
문제
Test set으로 모델의 최종성능 평가하기
앞서 stage3에 들어가면서, 가지고 있는 데이터를 training set, validation set, test set으로 나눴습니다.
하지만 test set은 전혀 사용한적이 없었습니다.
여러 모델을 만들고, training set으로 학습시킨 후 validation set으로 성능을 측정하였을 뿐입니다.
지금부터 할일은 stage3에서 가장 성능이 좋았던 모델을 하나 골라 training set과 validation set을 합한 데이터로 학습 시킨 후, test set으로 모델의 최종성능을 평가하는 것입니다.
방법
다음
단계를
따라
과제를
진행하세요.
[단계1]
Stage3 파일을 복사한 후 실행합니다. (파일이름은 homework1로 설정합니다)
[단계2]
모든 데이터를 8:2로 나누어 training set과 test set으로 만듭니다. 이 때 training set을 다시 나누어 validation set을 만드는 작업은 하지 않습니다.
[단계3]
선정한 모델을 test set을 이용해 최종 성능을 평가합니다.
최종 모델의 성능 스코어
[ ]
이제 코딩을 시작하세요! 코딩이 끝나면 모범답안과 비교해보세요.
Solution - 모범 답안
Previous
Challenge2 - Feature Scaling을 적용한 데이터의 Visualization
Next
과제2 - Linear Regression으로 타이타닉 생존자 예측해보기
Last modified
3yr ago
Copy link
Contents
문제
Test set으로 모델의 최종성능 평가하기
방법
다음 단계를 따라 과제를 진행하세요.