inflearn logo
강의

講義

知識共有

ハンズオン機械学習 第2版

第1章 (5)

훈련-개발 세트 문의

417

wqqqq

投稿した質問数 7

0

훈련-개발 세트는 예시를 들면 모바일 환경에서 얼굴을 인식하는 분류기를 만든다고 할 때, 데이터를 확보하기 위해 구글에 올라온 고해상도 이미지를 크롤링하여 고화질의 이미지를 얻지만 실제로는 다양한 해상도의 이미지로 사용될 때 성능이 안좋다면 과대적합인지 데이터 불일치인지 모르기 때문에 훈련-개발세트를 두는 것이고
이는 검증셋과는 별개이므로 이 때에는 훈련, 훈련-개발, 검증, 테스트로 나누는 방법으로 이해했는데 맞게 이해한 것일까요?
( 데이터를 훈련, 검증, 테스트로 나누는 것으로 인지했습니다.
그 중 훈련 데이터는 오로지 학습을 위해 사용되는 것이고
검증 셋은 하이퍼 파라미터 조정이나 여러 모델 중 가장 우수한 모델을 선택할 때 사용하는 것, 테스트 데이터는 머신러닝의 최종 성능 평가할 목적으로 사용되는 것으로 이해했습니다. )
질문이 장황해 죄송합니다.

딥러닝 NLP keras 강화학습 머신러닝 배워볼래요? tensorflow scikit-learn

回答 1

0

haesunpark

안녕하세요. 박해선입니다. 해상도를 포함해 여러가지 이유로 인한 데이터 불일치에 해당하는지 판단하기 위해서입니다. 감사합니다.

20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.

0

20

1

수업자료

0

23

2

pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다

0

22

1

모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?

0

31

2

강의 교안 요청

0

18

1

paperswithcode 서비스 종료 관련 문의

0

209

2

22강 코드 call()메서드 is_training -> model(x,False)로 호출시 밸류에러 참고

0

48

1

강의자료 질문

0

42

1

강의자료는 어떻게 보나요

0

84

2

resize 질문

0

50

1

1판으로 들어도 크게 무리가 없을지요?

0

70

1

슬라이드 링크

0

550

1

128페이지의 코드에 대해 질문하고 싶습니다:)

0

328

2

[89페이지] 테스트 세트의 소득 카테고리 비율에 대해 질문이 있습니다.

0

299

1

[84페이지] 특성값의 히스토그램 설명 부분

0

315

1

2부 강의에 관련하여

0

293

2

mnist 데이터가 안 불러와집니다.

0

403

1

책 내용 다시 질문합니다.

0

273

2

책 내용 질문입니다.

0

251

1

대용량 데이터 전처리 [분산 환경 수행] 방법

0

550

1

jupyterlab 관련해서 여쭤봐도 될까요?ㅠ

0

247

1

결측값 대체와 표준화에 관련해서 질문드립니다!

0

521

2

안녕하세요 2부 강의 기다리고 있습니다

2

385

1

안녕하세요. 유튜브로 강의 잘 보고 있습니다.

1

243

2