인프런 커뮤니티 질문&답변
Data Sampler와 Test and Score
작성
·
140
1
훈련데이터와 테스트 데이터를 나눠서 학습시킬때
-Data Sampler를 이용해서 나누는 경우
-Test and score에서 random sampling 옵션에서 지정하는 경우
이 두가지가 데이터를 나누는 부분에서는 같은 기능을 하는 건가요?
예를 들어 굳이 data sampler로 나누지 않고 , test and score 옵션에서 설정하면 되는건지요.
또, Test and score은 러너의 출력 쪽 방향인데, 어떻게 데이터가 분리되는지 궁금합니다.
답변 2
0
AI인턴이 답을 잘 해주었는데요 Data Sampler를 사용해서 명시적으로 데이터를 분리해 놓고 Sampling 된 데이터를 학습에 사용하고, Remaining Data 를 평가하는 데 사용할 수 있습니다. 이때는 Remaining Data 를    Predictions 위젯에 연결하면 성능평가치가 계산되어 나옵니다. Test and Score 위젯도 살펴보면 데이터를 입력받는 방법, 테스트를 실행하는 방법들을 다양하게 설정할 수 있습니다.
또는 데이터를 두 개의 그룹으로 나누어서 서로 다른 용도로 사용할 때 Data Sampler를 사용합니다.
0
안녕하세요, 인프런 AI 인턴입니다. 김경숙님.
질문 주신 내용에 대해 설명드리겠습니다. Orange3에서 데이터 샘플링과 평가 방법에 대한 이해는 데이터 분석에 매우 중요합니다.
- Data Sampler와 Test and Score의 차이: - Data Sampler: 이 위젯은 주어진 데이터셋을 학습 데이터와 테스트 데이터로 나누는 데 직접적인 역할을 하는 도구입니다. 사용자가 샘플링 비율을 조절하여 데이터를 나누고, 이 데이터를 다른 위젯으로 연결하여 사용할 수 있습니다.
 
- Test and Score: 이 위젯은 주로 머신러닝 모델의 성능을 평가하기 위해 사용됩니다. 여기에는 여러 평가 방법이 포함되며, 내부적으로 데이터를 무작위로 나누어 훈련과 테스트를 진행하는 기능을 수행할 수 있습니다. 이 위젯의 랜덤 샘플링 옵션은 데이터 샘플링을 자동으로 처리하여 모델의 성능 평가를 도와줍니다.
 
 
- Data Sampler: 이 위젯은 주어진 데이터셋을 학습 데이터와 테스트 데이터로 나누는 데 직접적인 역할을 하는 도구입니다. 사용자가 샘플링 비율을 조절하여 데이터를 나누고, 이 데이터를 다른 위젯으로 연결하여 사용할 수 있습니다.
- 두 기능의 비교: - 결과적으로 두 기능 모두 데이터를 나누는 일을 수행할 수 있지만, Data Sampler는 데이터 나누기를 명시적으로 준비하는 단계에 가깝고, Test and Score의 랜덤 샘플링 옵션은 모델 성능 평가에 특화되어 자동으로 데이터를 나누는 단계라고 보면 됩니다.
 
- 따라서, 간단하게 모델 평가를 원한다면 Test and Score 위젯만 사용해도 충분합니다. 그러나 나눠진 데이터를 분석하거나 다른 처리 과정을 거치려면 Data Sampler를 사용하는 것이 유리할 수 있습니다.
 
 
- 결과적으로 두 기능 모두 데이터를 나누는 일을 수행할 수 있지만, Data Sampler는 데이터 나누기를 명시적으로 준비하는 단계에 가깝고, Test and Score의 랜덤 샘플링 옵션은 모델 성능 평가에 특화되어 자동으로 데이터를 나누는 단계라고 보면 됩니다.
- 러너의 출력 방향과 데이터 분리: - Test and Score 위젯을 사용하면 내부적으로 데이터를 나누고 모델의 학습과 평가를 자동으로 수행합니다. 사용자가 일일이 데이터를 나눌 필요 없이 이 위젯 하나로 학습과 검증 과정을 간편하게 수행할 수 있습니다.
 
 
- Test and Score 위젯을 사용하면 내부적으로 데이터를 나누고 모델의 학습과 평가를 자동으로 수행합니다. 사용자가 일일이 데이터를 나눌 필요 없이 이 위젯 하나로 학습과 검증 과정을 간편하게 수행할 수 있습니다.
관련하여 비슷한 질문과 답변이 여기 게시되어 있으니 참고하시면 도움이 될 것 같습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.






답변 감사합니다. 그럼 data sampler와 test and score에서 데이터 분리를 중복으로 해도 상관이 없는건가요