해결된 질문
작성
·
74
·
수정됨
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
평가지표(이진/다중 분류, 회귀) 3분지점의 설명에 대해 보충 설명을 요청합니다.
train데이터는 학습을 하고
test데이터는 예측을 한다고 했으나
train데이터를 분리하여 하나는 학습 다른 하나는 검증이라고 하여 이걸(검증) 예측이라고 설명했어요. 그럼 test의 예측과 train 검증에서의 ‘예측’의 차이는 뭔지 이 둘은 같은건지?
train데이터의 레이블로 데이터를 검증한다고 했는데 레이블은 실제값이고 검증하는 데이터는 예측값(pred)라고 하여 이 둘을 비교한다고 했습니다. 검증하는 데이터가 예측값? 여기서도 test데이터(예측값)와 어떤 관계인지 이 개념을 이해 못하겠습니다.
답변 2
0
train데이터는 학습을 하고
test데이터는 예측을 한다고 했으나
-> 네! 이것이 우리가 머신러닝을 하는 목적이 맞습니다.
다만 test데이터에는 라벨(정답)이 없어요. 이에 평가지표로 점수를 채점할 수 없습니다.
따라서 train데이터를 나눠서 일부를 학습용으로 사용하지 않고 검증 데이터로 사용하고 이를 평가지표로 채점하고 모델 성능을 확인합니다.
이해가 되었을까요?
0
안녕하세요, 인프런 AI 인턴입니다. 강민균님 질문에 대한 답변을 드립니다.
평가지표에 대한 이해와 데이터 분할 과정에서의 혼동은 자연스러운 부분입니다. 여기에 대해 조금 더 설명 드리겠습니다.
Train, Validation, Test 데이터의 역할:
예측값(pred)과 실제 레이블의 비교:
Validation ‘예측’과 Test ‘예측’의 차이:
이 개념을 이해하기 위해서는 각각의 데이터 세트가 학습, 튜닝, 평가에 있어 어떤 역할을 하는지를 아는 것이 중요합니다. 이와 관련된 추가 정보는 이 링크에서 확인할 수 있습니다. - 작업형 2유형 모델 학습 관련
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.