강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

현우님의 프로필 이미지
현우

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

10회차 작업형2 결측치 논란 문의

작성

·

133

·

수정됨

0

시험문제에 'gas_totl(taeget)의 결측치는 0으로 대체했다' 라고 명시되어있는데 다들 뭐 삭제해야하니 평균 중앙값 처리해야하니 하는데.. 어떻게 생각하시나요..

솔직히 isnull에도 안잡혀서 그냥 처리됐구나 하고 넘어갔는데 불안감 조성하니까 착잡하네요.. 작업형1-3빼곤다맞았는데.. 이전에도 타겟값에 결측치있거나 그런문제가 있었나요?

 

추가로 작업형2 질문이 있습니다만..

  1. submit.to_csv('result.csv',index=False)

  2. 제출

  3. print(test.shape, submit.shape)

  4. result = pd.read_csv('result.csv')

  5. print(test.shape, result.shape)

이렇게 했는데 제출 한후에 파일 불러와서 형식이랑 result랑 테스트쉐잎 확인했는데 제출한 후에 확인해도 상관없는걸까요?? 그리고 이렇게 해도 괜찮은지도 질문드립니다.

답변 3

0

시험문제에 'gas_totl(taeget)의 결측치는 0으로 대체했다' 라고 명시되어있기 때문에 isnull에 안 잡히지 않았을까요? 0으로 만들어서..

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

1 데이터를 어떻게 만들었는지에 따라 달라집니다.
테스트 데이터에 대한 정보도, 도메인에 대한 정보도 없기 때문에 정확히 알 수 없습니다.
이런저런 상황을 고려했을 때, 테스트에 0이 포함되어 있다면 오차가 커질 가능성이 높기 때문에, 저 역시 그대로 두었을 것 같습니다.

 

2 네 상관없습니다.

0

평가치가 몇 나오셨나요? 전 결측치 안하고 하이퍼튜닝하니까 490까지 나왔습니다.
결측치 처리 안해도 점수가 좋게 나오더라고요.

대신 오브젝트 1개 있는거 원핫인코딩해서 넣었고요..

모 쉐입확인하는거야 문제 없을거 같습니다. 파일만 확인 하니까요.^^

현우님의 프로필 이미지
현우
질문자

저도 getdummies로 해주니까 컬럼 18갠가로 나온거로 시드0으로 랜포만 돌려줬습니다! 전 564인가 나왔네요 감사합니다!

현우님의 프로필 이미지
현우

작성한 질문수

질문하기