• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

혹시 Cabin이... 답일까요?

22.06.01 15:45 작성 조회수 109

0

안녕하세요. 수업 열심히 잘 듣고 있습니다~

(sum(is.na(df$Cabin))+sum(df$Cabin=='', na.rm=T))/nrow(df)

0.7710438

(sum(is.na(df$Embarked))+sum(df$Embarked=='', na.rm=T))/nrow(df)

0.002244669

이렇게 나오는데 여러번 해보았지만 같은 결과만 나옵니다. T.T

data 열어서 봐도, Cabin에 빈값이 엄청 많은데요... 혹시 답이 Cabin인지요? 아니면 강의하실 때 train.csv 파일과 제가 다운 받은 파일이 다른 파일일까요...

답변 1

답변을 작성해보세요.

0

 

안녕하세요.

말씀하신 대로 Cabin이 정답이 맞습니다. 그리고 결측치의 비율도 0.7710438이 맞습니다.

아래 다른 분이 질문을 주셨는데 제가 스크립트내에서 오타를 기입해서 그런 문제가 발생했습니다.

 

지난주에 강의자료를 다시 업로드 했으니 확인을 부탁드립니다.

제대로 작성하시고 제대로 된 정답을 얻으셨습니다.

 

다시 한 번 사과의 말씀을 드리겠습니다. 지적 감사드립니다.