inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

핸즈온 머신러닝 2

1장 (5)

훈련-개발 세트 문의

420

wqqqq

작성한 질문수 7

0

훈련-개발 세트는 예시를 들면 모바일 환경에서 얼굴을 인식하는 분류기를 만든다고 할 때, 데이터를 확보하기 위해 구글에 올라온 고해상도 이미지를 크롤링하여 고화질의 이미지를 얻지만 실제로는 다양한 해상도의 이미지로 사용될 때 성능이 안좋다면 과대적합인지 데이터 불일치인지 모르기 때문에 훈련-개발세트를 두는 것이고
이는 검증셋과는 별개이므로 이 때에는 훈련, 훈련-개발, 검증, 테스트로 나누는 방법으로 이해했는데 맞게 이해한 것일까요?
( 데이터를 훈련, 검증, 테스트로 나누는 것으로 인지했습니다.
그 중 훈련 데이터는 오로지 학습을 위해 사용되는 것이고
검증 셋은 하이퍼 파라미터 조정이나 여러 모델 중 가장 우수한 모델을 선택할 때 사용하는 것, 테스트 데이터는 머신러닝의 최종 성능 평가할 목적으로 사용되는 것으로 이해했습니다. )
질문이 장황해 죄송합니다.

딥러닝 NLP keras 강화학습 머신러닝 배워볼래요? tensorflow scikit-learn

답변 1

0

박해선

안녕하세요. 박해선입니다. 해상도를 포함해 여러가지 이유로 인한 데이터 불일치에 해당하는지 판단하기 위해서입니다. 감사합니다.

20강에서 파인튜닝 때 사용한 데이터가 없어졌습니다. LoRA Trainer 매개변수도 라이브러리 업그레이드로 수정되었습니다.

0

24

1

수업자료

0

29

2

pc에서는 괜찮은데 탭으로 들으니 화면확대시 화면이 까맙니다

0

24

1

모든 자료 다운로드 누를때마다 똑같은 excel파일이 다운로드 받아짐. 노션 주소 공유되나요?

0

35

2

강의 교안 요청

0

22

1

paperswithcode 서비스 종료 관련 문의

0

223

2

22강 코드 call()메서드 is_training -> model(x,False)로 호출시 밸류에러 참고

0

49

1

강의자료 질문

0

46

1

강의자료는 어떻게 보나요

0

89

2

resize 질문

0

51

1

1판으로 들어도 크게 무리가 없을지요?

0

75

1

슬라이드 링크

0

553

1

128페이지의 코드에 대해 질문하고 싶습니다:)

0

330

2

[89페이지] 테스트 세트의 소득 카테고리 비율에 대해 질문이 있습니다.

0

301

1

[84페이지] 특성값의 히스토그램 설명 부분

0

317

1

2부 강의에 관련하여

0

296

2

mnist 데이터가 안 불러와집니다.

0

406

1

책 내용 다시 질문합니다.

0

275

2

책 내용 질문입니다.

0

253

1

대용량 데이터 전처리 [분산 환경 수행] 방법

0

551

1

jupyterlab 관련해서 여쭤봐도 될까요?ㅠ

0

249

1

결측값 대체와 표준화에 관련해서 질문드립니다!

0

525

2

안녕하세요 2부 강의 기다리고 있습니다

2

386

1

안녕하세요. 유튜브로 강의 잘 보고 있습니다.

1

246

2