inflearn logo
강의

Course

Instructor

[PyTorch] Deep Learning Leading to Practical AI - From Basics to Paper Implementation

Data Imbalance(Data Imbalance)

데이터 불균형

Resolved

364

k3y3j39254

5 asked

1

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

 

안녕하세요. 데이터 불균형 수업 관련하여 질문드립니다.

 

수업중에 알려주신 예시는 classification 문제에서의 데이터 불균형 해결 방법을 알려주셨는데요,

혹시 regression 문제에서도 데이터 불균형 해결이 필요한것이 맞을까요? (예를들어 신장(키) 학습 시 평균 키를 가지는 샘플이 많은 경우)

 

regression 문제에서 데이터 불균형이 있을 경우, 어떤 방법으로 해결할 수 있을지 궁금합니다!

감사합니다.

python 머신러닝 딥러닝 인공신경망 pytorch

Answer 1

0

dlbro

안녕하세요.

말씀하신 회귀 문제에서의 불균형은 타겟 데이터의 불균형 분포를 말씀하시는 것이지요?

이에 대해 이상치 제거, 샘플링 기법(SMOGN 등)을 사용할 수 있습니다.

기본적으로 편향되지 않게 학습되는 것을 방지하는 것이 목표이기 때문에 이미 성능이 검증 된 앙상블 기법(XGboost 등)을 사용해도 됩니다.

데이터에 맞는 다양한 방법을 비교해 보시면 될 것 같습니다!

 

감사합니다.

 

수업자료 제공 부탁드립니다.

0

95

2

코드가 어디에 있는지 모르겠습니다.

0

93

2

논문 구현

0

184

2

overfitting이 나는 이유가 궁금합니다.

1

169

2

분류 성능이 잘 안 나오는 이유

0

217

1

AutoEncoder 차원 질문

1

250

2

사전 학습 모델에서의 layer 변경에 대한 질문

1

218

1

7강 폴더 만들

0

259

1

4-3강 cross-validation에서의 best model 선정 기준

0

447

1

regression 문제에 대한 결과 시각화

0

213

1

Loss function 관련하여 질문드립니다.

0

954

1

early stopping 코드 문의

0

325

1

예측 그래프

0

353

1

8강 전이 학습 질문

0

395

2

data의 gpu처리 질문

0

240

1

nn.Linear(1024, 10) 관련 질문드립니다.

0

287

1

학습과 평가시 Loss 함수가 다른 이유

0

249

1

전처리 관련해서 질문 있습니다.

0

224

1

데이터 엔지니어의 역량을 기르려면 어떻게 해야할까요?

0

933

2

역전파 내용 중 미분 관련 질문 드립니다

1

282

1

8강 전이학습에서 kernel size 관련 질문 드립니다.

1

956

1

이미지분류-합성곱신경망(CNN) 피쳐맵 질문입니다.

1

585

1

14강 데이터 불균형 RandomRotation

1

481

1

3장 데이터 불러오기에서 LinearTensor를 정의하는 이유가 궁금합니다.

1

324

1