데이터 사이언스 LV1 입문
현장 강의
Search…
데이터 사이언스 LV1 입문
사전 준비
1주차 - 데이터 사이언스 마인드
2주차 - 딱 데이터 사이언스를 위한 파이썬
3주차 - Decision Tree로 타이타닉 생존자 찾기
4주차 - Random Forest로 아이리스 종 구분하기
Solution - 모범 답안
Stage1 - Random Forest를 배워보자
Stage2 - Iris 문제 Feature Engineering
Challenge1 - Pair plot 만들기
Stage3 - Scikit-learn으로 Random Forest 구현하기
Stage4 - Multi-class Classification Problem
Challenge2 - 타이타닉 문제에서 학습 부분을 Random Forest로 바꿔보기
과제1 - 타이타닉 데이터셋 구성 다시하기
과제2 - 타이타닉 문제에 적용한 random forest의 파라미터를 변경해보기
5주차 - 회귀분석으로 집 값 예측하기
6주차 - LV1 데이터 사이언티스트 되기
나아가기
코딩좀알려주라
Powered By
GitBook
과제2 - 타이타닉 문제에 적용한 random forest의 파라미터를 변경해보기
문제
타이타닉 문제에 적용한 random forest의 파라미터를 변경해보기
방금 과제1에서 진행한 모델에 파라미터를 수정하고 그에 따른 장단점을 분석, 최종적으로 Kaggle에 제출하는 작업을 진행하겠습니다.
파라미터
기본값
영향
n_estimators
10 혹은 100
작을 수록 overfitting이 완화된다
max_depth
무제한
클 수록 트리가 깊어진다
이 값들을 미세하게 조정하면서 Kaggle에 제출했을 때 가장 높은 점수가 나오는게 목표입니다.
방법
다음
단계를
따라
과제를
진행하세요.
[단계1]
과제1(homework1)파일을 복사한 후 실행합니다. 파일이름은 homework2로 해주세요.
[단계2]
Stage4를 복습합니다.
[단계3]
여러 파라미터 조합쌍을 직접 실험하며 그 차이를 이해합니다.
[단계4]
Kaggle에 제출해보세요! (목표는 0.75점 이상입니다.) 몇 점 나오셨나요?
[ ]
[단계5]
타이타닉 문제는 여기서 마무리됩니다. 본인만의 아이디어를 적용해 더 높은 점수에 도달해보세요.
[단계6]
모범답안과 비교해보세요!
Solution - 모범 답안
Previous
과제1 - 타이타닉 데이터셋 구성 다시하기
Next
5주차 - 회귀분석으로 집 값 예측하기
Last modified
3yr ago
Copy link
Contents
문제
타이타닉 문제에 적용한 random forest의 파라미터를 변경해보기
방법
다음 단계를 따라 과제를 진행하세요.