1-3번문제 질문
2
投稿した質問数 1
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
15분 부근 내용입니다!
1-3번 풀때 model.predict 안에 test를 그대로 넣어서 예측하고있는데, 그러면 정답 컬럼을 가지고 예측하는건가요? 작업형2처럼 분리를 안하고 정답을 그대로 넣으면 되는건지 궁금합니다!
回答 1
0
안녕하세요, 인프런 AI 인턴입니다. jhjeon0312님.
모델 예측 시 model.predict에 들어가는 데이터는 일반적으로 학습 데이터로부터 변수(feature)만을 포함하며, 정답(target) 컬럼을 포함하지 않아야 합니다. 예측에 활용될 데이터는 예측할 대상의 변수를 기반으로 결과를 산출하기 때문에, 모델이 정답을 미리 알지 않은 상태에서 작동해야 타당한 결과가 나옵니다.
기본적으로는 다음과 같은 과정으로 진행됩니다:
1. 훈련 데이터 (train): 모델을 학습하는 데 사용, 여기에는 feature와 target이 모두 포함됩니다.
2. 테스트 데이터 (test): 모델의 예측 성능을 평가하는 데 사용되며, feature만 사용하여 예측합니다. 이후 예측 결과를 실제 target과 비교하여 성능을 평가합니다.
따라서 test 데이터셋에 model.predict를 수행할 때 정답(target) 컬럼은 제외하고 예측에 필요한 feature들만을 사용해야 합니다. 기능을 올바르게 이해하고 사용하시길 바랍니다.
관련된 유사한 질문과 답변이 있어 참고하시면 도움이 될 것입니다:
- “2유형 질문입니다”: train 데이터를 분할하여 모델을 검증하는 과정에 대한 설명.
- “4회 작업형 2번 풀이 질문있습니다.”: 올바른 데이터셋 사용과 모델 검증에 관한 질문.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
회귀모델 평가지표 최근 시험환경에서의 지원여부가 궁금합니다
0
8
1
컬럼 삭제 관련
0
6
1
레이블 인코딩과 원핫 인코딩
0
17
2
검정결과 질문(채택/기각)
0
23
2
수강기간 연장 가능 여부 문의
0
27
2
마인드맵에서 암기해야할 내용은 별마크 인가요
0
28
2
수강 연장 문의드립니다
0
24
2
2유형 관련 질문
0
28
2
수강기간 연장 문의드립니다
0
30
2
로지스틱 회귀 데이터 누락 관련 질문
0
32
2
수강기간 연장 문의드립니다.
0
32
2
작업형1 - 연습문제 1번 관련 질문입니다.
0
41
2
강의 자료 16~39 관련
0
45
2
데이터 전처리 시 문의
0
43
2
random_state 값
0
41
2
인코딩 사용여부
0
51
2
인코딩 전 데이터 합치기 질문드립니다!
0
45
1
섹션5. 회귀 강의 관련 질문드립니다
0
48
2
수강기간연장 문의드립니다
0
64
2
수강 연장 문의
0
50
2
label 인코딩 에러 발생 원인
0
48
2
LabelEncoding 시 train data 학습(fit_transform, transform)
0
46
2
로지스틱 회귀분석은 옛날거 밖에 없나요?
0
50
2
판다스 표 표시
0
38
3

