inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

빅데이터분석기사 실기대비 (R 활용)

X_test 데이터셋 전처리 질문

179

차재훈

작성한 질문수 4

0

안녕하세요,

 

X_test 데이터는 X_train과 y_train을 합친 Train 데이터셋과 동일하게 칼럼을 만들어야 한다고 이해했습니다.

 

혹시, X_test 데이터에 NA 값이 있어 전처리를 진행할때, 해당 칼럼을 삭제하거나 대체하지 않고 row 데이터를 삭제할 순 없나요?

 

Test 데이터셋은 행 삭제를 하면 안된다고 들어서요..

 

 

감사합니다.

bigdata

답변 1

0

companionclub

안녕하세요.

X_test 데이터는 X_train데이터와 동일하기 때문에 y_train까지 포함해서 합치려면

y_test를 강제로 만들어서 합쳐주셔야 합니다. (변수하나 생성)

하지만, 시험에서는 그럴필요는 없다고 판단됩니다. (X_train과 X_test만 합쳐도 무방)

 

X_test의 row를 삭제하시면 안됩니다.

시험결과 파일은 각 row별 확률을 제출하는 것이기 때문에 (혹은 예측값),

만약 row를 지우시면 0점이 될수도 있습니다. 그 점 유념하셔서 절대 지우지마시고 연습하시길 권장드립니다.

마지막 질문이될것같습니다 선생님!!

0

305

1

5회 2유형

0

357

1

작업형제2유형 질문입니다.

0

430

1

rmse질문입니다.

0

349

1

제5회 빅데이터분석기사 실기 응시 가이드 질문입니다.

0

457

2

제4회 실기시험 리뷰 작업형2문제

0

429

2

출제예상문제풀이 1번 문제 질문입니다

0

296

1

제4회 실기시험 리뷰 작업형1에서 3번문제 질문입니다.

0

201

1

제4회 실기시험 리뷰 작업형1질문 1번문제

0

281

1

회귀모델구축 질문입니다.

0

289

2

작업형 2유형 질문

0

258

1

작업형 제2유형 질문입니다.

0

185

1

작업형제2유형 질문입니다.

0

240

2

제4회 작업형2 실기 질문입니다.

0

290

2

제4회 작업형2 실기시험 질문입니다.

0

335

2

3회 작업형 1유형 전처리 문제

0

275

1

예상문제 작업2유형 샘플파일이 읽혀지지 않는 문제

0

308

3

실기4 유형2 질문

0

209

1

실기 3회 유형2 세부사항 문의

0

248

2

섹션 4 예상문제

0

198

1

열공중입니다 도와주세요 감사합니다!!

0

181

1

학습 질문있습니다!

0

239

1

덕분에 합격했습니다만..

0

183

1

덕분에 합격했습니다.

1

174

1