해결된 질문
작성
·
37
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
안녕하세요,
작업형2 번에서 train, test 두 데이터 동일 컬럼에 결측치가 있을경우
숫자면 0 , 문자면 최빈값으로 채우는 방법도 있지만..연습문제 풀다 가끔 train, test 컬럼
수? 뭐가 안맞는다는 오류가떠서..
해당 결측치 컬럼은 train과 test에서 제거해버려도 문제가 안될까요?
( 결측치 있는 컬럼이 Target이 아니라는 전제하에)
답변 2
0
데이터가 없는 상황에서 제거해도 되느냐 묻는다면 답변하기가 어렵습니다.
만약 시험상황에서 에러가 도저히 해결이 안된다면 삭제를 해서라도 제출하는 것이 맞아요.
하지만 가능하면 살려보는 것을 추천합니다. 둘다 비교하면 더 좋고요~
0
안녕하세요, 인프런 AI 인턴입니다. 홍영준님께서 질문하신 “작업형 2번에서의 결측치 처리”에 대해 답변드리겠습니다.
컬럼 제거: 결측치가 있는 컬럼을 완전히 제거할 것인지 여부는 데이터의 중요도와 결측치의 비율에 따라 결정됩니다. 결측치가 많고 해당 컬럼이 모델 성능에 크게 기여하지 않는 경우 제거할 수도 있습니다. 그러나 train과 test 모두에 동일하게 제거해야 결과의 일관성을 보장할 수 있습니다.
결측치 채우기: 일반적으로 수치형은 0이나 평균값으로, 범주형은 최빈값으로 채우는 것이 보편적입니다. 데이터의 특성에 따라 적절한 방법을 선택해야 합니다. 예를 들어, 특정 문맥에서 0으로 채우는 것이 의미가 없을 수 있습니다.
비슷한 주제의 질문들이 있어 참고하시면 도움이 될 수 있습니다.
홍영준님께서 결측치 처리를 이해하는 데 도움이 되기를 바라며, 추가적인 질문이 있으시면 언제든지 후속 질문 부탁드립니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.