실제 시험에서 이상치 발견 시
만약 시험 환경에서 age 데이터가 주어지고 - 값이 있는 것을 확인했다면,
따로 이상치를 제거하란 말이 없으면 - 값을 그대로 놔둬야 할까요, 아니면 제가 스스로 판단해서 - 값을 제거해주어야할까요?
답변 2
0
데이터를 알고 이야기하는 것이 아니라 이상치 부분은 정말 조심스럽습니다.
이상치에 대해 문제에서 언급하지 않는다면 처리하지 않는 것으로 하시죠!!
만약 시험 환경에서 age 데이터가 주어지고 - 값이 있는 것을 확인했다면,
이 가정을 저에게 준다면
시험이다보니 일단 그냥 두겠습니다. 입문자가 이상치 처리하려다 실수할 가능성이 너무 올라갑니다.
그렇지만 이상치 처리를 굳이 하고 싶다면 train에 -가 있고, test에도 -가 있는지 확인 하겠어요! 만약 test에도 -가 있다면 이건 이유가 있는 데이터 입니다. 그대로 둡니다.
train -가 있고, test -가 없다면 ... 도전해볼만해요!
그렇지만 그 데이터가 소수가 아니라 많다면 또 고민할 것 같아요 시험에서 주어지는 데이터가 많은 데이터는 아니어서요!
결론은 문제에서 언급하지 않으면 그냥 두시죠!!
질문 드립니다.
0
37
2
강의 내용 관련 질문드립니다~
0
34
2
수강 연장 문의
0
32
1
강의자료 일괄 다운로드
0
41
2
수강기간 연장 문의드립니다
0
28
1
list 문제 질문드립니다~
0
28
2
빅분기 실기 12회 재도전
0
39
1
강의 기간 연장 가능여부 검토 요청건
0
30
1
수강기간 연장 문의 드립니다
0
36
2
수강기간 연장 문의드립니다
0
47
2
질문이요
0
51
2
수강기간 연장 문의드립니다.
0
50
2
문제 3-2 질문드립니다
0
43
2
수강기간 연장 문의 드립니다.
0
58
2
변수, 칼럼 , df 구분
0
49
2
수강기간 연장 문의드립니다.
0
49
2
수강기간 연장 문의
0
47
2
수강기간 연장 문의드립니다.
0
40
2
수강기한 연장 문의
0
79
2
수강기간 연장 문의드립니다
0
57
2
결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유
0
44
2
수강기간 연장 문의드립니다.
0
70
2
수강연장 문의
0
76
2
수강연장문의
0
53
2





