작성
·
133
·
수정됨
0
시험문제에 'gas_totl(taeget)의 결측치는 0으로 대체했다' 라고 명시되어있는데 다들 뭐 삭제해야하니 평균 중앙값 처리해야하니 하는데.. 어떻게 생각하시나요..
솔직히 isnull에도 안잡혀서 그냥 처리됐구나 하고 넘어갔는데 불안감 조성하니까 착잡하네요.. 작업형1-3빼곤다맞았는데.. 이전에도 타겟값에 결측치있거나 그런문제가 있었나요?
추가로 작업형2 질문이 있습니다만..
submit.to_csv('result.csv',index=False)
제출
print(test.shape, submit.shape)
result = pd.read_csv('result.csv')
print(test.shape, result.shape)
이렇게 했는데 제출 한후에 파일 불러와서 형식이랑 result랑 테스트쉐잎 확인했는데 제출한 후에 확인해도 상관없는걸까요?? 그리고 이렇게 해도 괜찮은지도 질문드립니다.
답변 3
0
0
1 데이터를 어떻게 만들었는지에 따라 달라집니다.
테스트 데이터에 대한 정보도, 도메인에 대한 정보도 없기 때문에 정확히 알 수 없습니다.
이런저런 상황을 고려했을 때, 테스트에 0이 포함되어 있다면 오차가 커질 가능성이 높기 때문에, 저 역시 그대로 두었을 것 같습니다.
2 네 상관없습니다.
0
평가치가 몇 나오셨나요? 전 결측치 안하고 하이퍼튜닝하니까 490까지 나왔습니다.
결측치 처리 안해도 점수가 좋게 나오더라고요.
대신 오브젝트 1개 있는거 원핫인코딩해서 넣었고요..
모 쉐입확인하는거야 문제 없을거 같습니다. 파일만 확인 하니까요.^^
저도 getdummies로 해주니까 컬럼 18갠가로 나온거로 시드0으로 랜포만 돌려줬습니다! 전 564인가 나왔네요 감사합니다!