강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của codingks2295
codingks2295

câu hỏi đã được viết

Phân tích dữ liệu và học máy không yêu cầu mã hóa - Khái niệm cơ bản về Orange3

Cài đặt Orange3

Data Sampler와 Test and Score

Viết

·

222

1

훈련데이터와 테스트 데이터를 나눠서 학습시킬때

-Data Sampler를 이용해서 나누는 경우

-Test and score에서 random sampling 옵션에서 지정하는 경우

이 두가지가 데이터를 나누는 부분에서는 같은 기능을 하는 건가요?

예를 들어 굳이 data sampler로 나누지 않고 , test and score 옵션에서 설정하면 되는건지요.

 

또, Test and score은 러너의 출력 쪽 방향인데, 어떻게 데이터가 분리되는지 궁금합니다.

Orange3

Câu trả lời 2

0

ellie님의 프로필 이미지
ellie
Người chia sẻ kiến thức

AI인턴이 답을 잘 해주었는데요 Data Sampler를 사용해서 명시적으로 데이터를 분리해 놓고 Sampling 된 데이터를 학습에 사용하고, Remaining Data 를 평가하는 데 사용할 수 있습니다. 이때는 Remaining Data 를 Predictions 위젯에 연결하면 성능평가치가 계산되어 나옵니다. Test and Score 위젯도 살펴보면 데이터를 입력받는 방법, 테스트를 실행하는 방법들을 다양하게 설정할 수 있습니다.

또는 데이터를 두 개의 그룹으로 나누어서 서로 다른 용도로 사용할 때 Data Sampler를 사용합니다.

0

안녕하세요, 인프런 AI 인턴입니다. 김경숙님.

질문 주신 내용에 대해 설명드리겠습니다. Orange3에서 데이터 샘플링과 평가 방법에 대한 이해는 데이터 분석에 매우 중요합니다.

  1. Data Sampler와 Test and Score의 차이:

    • Data Sampler: 이 위젯은 주어진 데이터셋을 학습 데이터와 테스트 데이터로 나누는 데 직접적인 역할을 하는 도구입니다. 사용자가 샘플링 비율을 조절하여 데이터를 나누고, 이 데이터를 다른 위젯으로 연결하여 사용할 수 있습니다.
    • Test and Score: 이 위젯은 주로 머신러닝 모델의 성능을 평가하기 위해 사용됩니다. 여기에는 여러 평가 방법이 포함되며, 내부적으로 데이터를 무작위로 나누어 훈련과 테스트를 진행하는 기능을 수행할 수 있습니다. 이 위젯의 랜덤 샘플링 옵션은 데이터 샘플링을 자동으로 처리하여 모델의 성능 평가를 도와줍니다.
  2. 두 기능의 비교:

    • 결과적으로 두 기능 모두 데이터를 나누는 일을 수행할 수 있지만, Data Sampler는 데이터 나누기를 명시적으로 준비하는 단계에 가깝고, Test and Score의 랜덤 샘플링 옵션은 모델 성능 평가에 특화되어 자동으로 데이터를 나누는 단계라고 보면 됩니다.
    • 따라서, 간단하게 모델 평가를 원한다면 Test and Score 위젯만 사용해도 충분합니다. 그러나 나눠진 데이터를 분석하거나 다른 처리 과정을 거치려면 Data Sampler를 사용하는 것이 유리할 수 있습니다.
  3. 러너의 출력 방향과 데이터 분리:

    • Test and Score 위젯을 사용하면 내부적으로 데이터를 나누고 모델의 학습과 평가를 자동으로 수행합니다. 사용자가 일일이 데이터를 나눌 필요 없이 이 위젯 하나로 학습과 검증 과정을 간편하게 수행할 수 있습니다.

관련하여 비슷한 질문과 답변이 여기 게시되어 있으니 참고하시면 도움이 될 것 같습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

kskim님의 프로필 이미지
kskim
Người đặt câu hỏi

답변 감사합니다. 그럼 data sampler와 test and score에서 데이터 분리를 중복으로 해도 상관이 없는건가요

Hình ảnh hồ sơ của codingks2295
codingks2295

câu hỏi đã được viết

Đặt câu hỏi