X_test 데이터셋 전처리 질문
179
작성한 질문수 4
안녕하세요,
X_test 데이터는 X_train과 y_train을 합친 Train 데이터셋과 동일하게 칼럼을 만들어야 한다고 이해했습니다.
혹시, X_test 데이터에 NA 값이 있어 전처리를 진행할때, 해당 칼럼을 삭제하거나 대체하지 않고 row 데이터를 삭제할 순 없나요?
Test 데이터셋은 행 삭제를 하면 안된다고 들어서요..
감사합니다.
답변 1
0
안녕하세요.
X_test 데이터는 X_train데이터와 동일하기 때문에 y_train까지 포함해서 합치려면
y_test를 강제로 만들어서 합쳐주셔야 합니다. (변수하나 생성)
하지만, 시험에서는 그럴필요는 없다고 판단됩니다. (X_train과 X_test만 합쳐도 무방)
X_test의 row를 삭제하시면 안됩니다.
시험결과 파일은 각 row별 확률을 제출하는 것이기 때문에 (혹은 예측값),
만약 row를 지우시면 0점이 될수도 있습니다. 그 점 유념하셔서 절대 지우지마시고 연습하시길 권장드립니다.
마지막 질문이될것같습니다 선생님!!
0
305
1
5회 2유형
0
357
1
작업형제2유형 질문입니다.
0
430
1
rmse질문입니다.
0
349
1
제5회 빅데이터분석기사 실기 응시 가이드 질문입니다.
0
457
2
제4회 실기시험 리뷰 작업형2문제
0
429
2
출제예상문제풀이 1번 문제 질문입니다
0
296
1
제4회 실기시험 리뷰 작업형1에서 3번문제 질문입니다.
0
201
1
제4회 실기시험 리뷰 작업형1질문 1번문제
0
281
1
회귀모델구축 질문입니다.
0
289
2
작업형 2유형 질문
0
258
1
작업형 제2유형 질문입니다.
0
185
1
작업형제2유형 질문입니다.
0
240
2
제4회 작업형2 실기 질문입니다.
0
290
2
제4회 작업형2 실기시험 질문입니다.
0
335
2
3회 작업형 1유형 전처리 문제
0
275
1
예상문제 작업2유형 샘플파일이 읽혀지지 않는 문제
0
308
3
실기4 유형2 질문
0
209
1
실기 3회 유형2 세부사항 문의
0
248
2
섹션 4 예상문제
0
198
1
열공중입니다 도와주세요 감사합니다!!
0
181
1
학습 질문있습니다!
0
239
1
덕분에 합격했습니다만..
0
183
1
덕분에 합격했습니다.
1
174
1





