과제2 - 타이타닉 문제에 적용한 random forest의 파라미터를 변경해보기

문제

타이타닉 문제에 적용한 random forest의 파라미터를 변경해보기

방금 과제1에서 진행한 모델에 파라미터를 수정하고 그에 따른 장단점을 분석, 최종적으로 Kaggle에 제출하는 작업을 진행하겠습니다.

파라미터

기본값

영향

n_estimators

10 혹은 100

작을 수록 overfitting이 완화된다

max_depth

무제한

클 수록 트리가 깊어진다

이 값들을 미세하게 조정하면서 Kaggle에 제출했을 때 가장 높은 점수가 나오는게 목표입니다.

방법

다음 단계를 따라 과제를 진행하세요.

[단계1] 과제1(homework1)파일을 복사한 후 실행합니다. 파일이름은 homework2로 해주세요.

[단계2] Stage4를 복습합니다.

[단계3] 여러 파라미터 조합쌍을 직접 실험하며 그 차이를 이해합니다.

[단계4] Kaggle에 제출해보세요! (목표는 0.75점 이상입니다.) 몇 점 나오셨나요? [ ]

[단계5] 타이타닉 문제는 여기서 마무리됩니다. 본인만의 아이디어를 적용해 더 높은 점수에 도달해보세요.

[단계6] 모범답안과 비교해보세요!