• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    해결됨

데이터 불균형

23.12.27 15:20 작성 조회수 129

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

 

안녕하세요. 데이터 불균형 수업 관련하여 질문드립니다.

 

수업중에 알려주신 예시는 classification 문제에서의 데이터 불균형 해결 방법을 알려주셨는데요,

혹시 regression 문제에서도 데이터 불균형 해결이 필요한것이 맞을까요? (예를들어 신장(키) 학습 시 평균 키를 가지는 샘플이 많은 경우)

 

regression 문제에서 데이터 불균형이 있을 경우, 어떤 방법으로 해결할 수 있을지 궁금합니다!

감사합니다.

답변 1

답변을 작성해보세요.

0

안녕하세요.

말씀하신 회귀 문제에서의 불균형은 타겟 데이터의 불균형 분포를 말씀하시는 것이지요?

이에 대해 이상치 제거, 샘플링 기법(SMOGN 등)을 사용할 수 있습니다.

기본적으로 편향되지 않게 학습되는 것을 방지하는 것이 목표이기 때문에 이미 성능이 검증 된 앙상블 기법(XGboost 등)을 사용해도 됩니다.

데이터에 맞는 다양한 방법을 비교해 보시면 될 것 같습니다!

 

감사합니다.