강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

kskim님의 프로필 이미지
kskim

작성한 질문수

코딩이 필요 없는 데이터분석, 머신러닝 - 오렌지3(Orange3) 기초

Orange3 설치하기

Data Sampler와 Test and Score

작성

·

114

1

훈련데이터와 테스트 데이터를 나눠서 학습시킬때

-Data Sampler를 이용해서 나누는 경우

-Test and score에서 random sampling 옵션에서 지정하는 경우

이 두가지가 데이터를 나누는 부분에서는 같은 기능을 하는 건가요?

예를 들어 굳이 data sampler로 나누지 않고 , test and score 옵션에서 설정하면 되는건지요.

 

또, Test and score은 러너의 출력 쪽 방향인데, 어떻게 데이터가 분리되는지 궁금합니다.

답변 2

0

엘리쌤님의 프로필 이미지
엘리쌤
지식공유자

AI인턴이 답을 잘 해주었는데요 Data Sampler를 사용해서 명시적으로 데이터를 분리해 놓고 Sampling 된 데이터를 학습에 사용하고, Remaining Data 를 평가하는 데 사용할 수 있습니다. 이때는 Remaining Data 를 Predictions 위젯에 연결하면 성능평가치가 계산되어 나옵니다. Test and Score 위젯도 살펴보면 데이터를 입력받는 방법, 테스트를 실행하는 방법들을 다양하게 설정할 수 있습니다.

또는 데이터를 두 개의 그룹으로 나누어서 서로 다른 용도로 사용할 때 Data Sampler를 사용합니다.

0

안녕하세요, 인프런 AI 인턴입니다. 김경숙님.

질문 주신 내용에 대해 설명드리겠습니다. Orange3에서 데이터 샘플링과 평가 방법에 대한 이해는 데이터 분석에 매우 중요합니다.

  1. Data Sampler와 Test and Score의 차이:

    • Data Sampler: 이 위젯은 주어진 데이터셋을 학습 데이터와 테스트 데이터로 나누는 데 직접적인 역할을 하는 도구입니다. 사용자가 샘플링 비율을 조절하여 데이터를 나누고, 이 데이터를 다른 위젯으로 연결하여 사용할 수 있습니다.
    • Test and Score: 이 위젯은 주로 머신러닝 모델의 성능을 평가하기 위해 사용됩니다. 여기에는 여러 평가 방법이 포함되며, 내부적으로 데이터를 무작위로 나누어 훈련과 테스트를 진행하는 기능을 수행할 수 있습니다. 이 위젯의 랜덤 샘플링 옵션은 데이터 샘플링을 자동으로 처리하여 모델의 성능 평가를 도와줍니다.
  2. 두 기능의 비교:

    • 결과적으로 두 기능 모두 데이터를 나누는 일을 수행할 수 있지만, Data Sampler는 데이터 나누기를 명시적으로 준비하는 단계에 가깝고, Test and Score의 랜덤 샘플링 옵션은 모델 성능 평가에 특화되어 자동으로 데이터를 나누는 단계라고 보면 됩니다.
    • 따라서, 간단하게 모델 평가를 원한다면 Test and Score 위젯만 사용해도 충분합니다. 그러나 나눠진 데이터를 분석하거나 다른 처리 과정을 거치려면 Data Sampler를 사용하는 것이 유리할 수 있습니다.
  3. 러너의 출력 방향과 데이터 분리:

    • Test and Score 위젯을 사용하면 내부적으로 데이터를 나누고 모델의 학습과 평가를 자동으로 수행합니다. 사용자가 일일이 데이터를 나눌 필요 없이 이 위젯 하나로 학습과 검증 과정을 간편하게 수행할 수 있습니다.

관련하여 비슷한 질문과 답변이 여기 게시되어 있으니 참고하시면 도움이 될 것 같습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

kskim님의 프로필 이미지
kskim
질문자

답변 감사합니다. 그럼 data sampler와 test and score에서 데이터 분리를 중복으로 해도 상관이 없는건가요

kskim님의 프로필 이미지
kskim

작성한 질문수

질문하기