사람의 이름이 생존율에 영향을 미친다고 생각하기는 어렵겠죠. (‘박지성’, ‘이청용’, ‘손흥민’ 이름 때문에 생존율이 바뀌지는 않겠죠?)
하지만 Name열을 자세히 살펴보면 다른 정보가 숨어 있습니다. Miss, Mrs, Mr과 같은 타이틀은 어쩌면 영향을 미칠 수도 있겠네요. 이름에 포함된 타이틀 정보를 다루는 새로운 열을 만들어 Pivot Table로 분석해보세요. 이를 반영하여 생존을 예측해 Kaggle에 제출하여 점수를 확인해보세요!
제출할 때는 반드시 PassengerId와 Survived열만 남겨야 합니다.
방법
다음단계를따라과제를진행하세요.
[단계1] Stage3을 복습합니다.
[단계2] Name열에서 Miss, Mrs, Mr과 같은 타이틀 정보만
추출합니다.
[단계3] 나만의 가중치 합산 방식을 만들어 Name으로 부터 얻은 데이터까지 사용해봅시다.