inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

10회차 작업형2 결측치 논란 문의

Đã giải quyết

181

bylhw973601

14 câu hỏi đã được viết

0

시험문제에 'gas_totl(taeget)의 결측치는 0으로 대체했다' 라고 명시되어있는데 다들 뭐 삭제해야하니 평균 중앙값 처리해야하니 하는데.. 어떻게 생각하시나요..

솔직히 isnull에도 안잡혀서 그냥 처리됐구나 하고 넘어갔는데 불안감 조성하니까 착잡하네요.. 작업형1-3빼곤다맞았는데.. 이전에도 타겟값에 결측치있거나 그런문제가 있었나요?

 

추가로 작업형2 질문이 있습니다만..

  1. submit.to_csv('result.csv',index=False)

  2. 제출

  3. print(test.shape, submit.shape)

  4. result = pd.read_csv('result.csv')

  5. print(test.shape, result.shape)

이렇게 했는데 제출 한후에 파일 불러와서 형식이랑 result랑 테스트쉐잎 확인했는데 제출한 후에 확인해도 상관없는걸까요?? 그리고 이렇게 해도 괜찮은지도 질문드립니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 3

0

sj970617

시험문제에 'gas_totl(taeget)의 결측치는 0으로 대체했다' 라고 명시되어있기 때문에 isnull에 안 잡히지 않았을까요? 0으로 만들어서..

0

roadmap

1 데이터를 어떻게 만들었는지에 따라 달라집니다.
테스트 데이터에 대한 정보도, 도메인에 대한 정보도 없기 때문에 정확히 알 수 없습니다.
이런저런 상황을 고려했을 때, 테스트에 0이 포함되어 있다면 오차가 커질 가능성이 높기 때문에, 저 역시 그대로 두었을 것 같습니다.

 

2 네 상관없습니다.

0

flip lee

평가치가 몇 나오셨나요? 전 결측치 안하고 하이퍼튜닝하니까 490까지 나왔습니다.
결측치 처리 안해도 점수가 좋게 나오더라고요.

대신 오브젝트 1개 있는거 원핫인코딩해서 넣었고요..

모 쉐입확인하는거야 문제 없을거 같습니다. 파일만 확인 하니까요.^^

0

bylhw973601

저도 getdummies로 해주니까 컬럼 18갠가로 나온거로 시드0으로 랜포만 돌려줬습니다! 전 564인가 나왔네요 감사합니다!

제2유형 질문입니다.

0

15

1

C()

0

13

1

작업형 2에서 strafity 적용 유무

0

21

2

수강 기간 연장 가능 여부 문의드립니다.

0

17

1

ols

0

18

2

2유형 작성관련 질문(일반 심화)

0

21

2

2유형 작성관련 질문

0

18

2

2유형 object컬럼 개수 다르면

0

20

2

코딩팡질문이요ㅠㅠ

0

22

2

관찰값과 기대값의 개념이 헷갈립니다.

0

13

2

작업형2 ID 컬럼 삭제 질문

0

23

2

2유형 작성관련 질문

0

20

2

memoryerror 질문

0

18

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

21

1

ID 삭제 필수 인가요?

0

19

3

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

16

2

3 유형 귀무가설, 대립가설

0

20

2

인코딩 관련 질문 있습니다

0

23

2

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

27

2

2유형 원핫인코딩 오류

0

23

2

시험장에서 주석 단축키 안될 때 많나요?

0

28

2

라벨인코딩 방식

0

28

2

test 재학습 관련

0

16

2

target 빈도 확인

0

18

2