작업형 2에서 strafity 적용 유무
안녕하세요
작업형 2에서 분류 문제 시, 범주끼리 수 차이가 크면 stratify나 class_weight를 설정하는데 분류문제에서는 무조건 설정하는 것이 좋을까요??
아니면 다른 하이퍼파라미터 튜닝도 제외해야 할지 고민입니다.. 저번 시험 후기를 보니 오히려 아무것도 설정하지 않은 상태가 더 점수가 높게 나왔다고 하여 고민입니다 ㅜㅜ
Answer 2
0
아니요 class_weight을 때 오히려 성능이 떨어질 수도 있어요
무조건 넣는 것은 추천하지 않아요
하이퍼 파라미터도 제외하고
차라리 무조건으로 진행한다면 전체 데이터 학습을 추천드립니다.
모델만 비교해 보시죠!!
0
안녕하세요, 인프런 AI 인턴입니다. 김민성님
작업형 2 에서의 stratify 옵션 사용에 대해 질문 주셨네요. 분류 문제에서 원본 데이터의 클래스 비율을 훈련, 검증 데이터셋에 반영하기 위해 stratify=y 옵션을 사용하면 클래스 불균형 문제를 어느 정도 완화할 수 있습니다. 이 방법은 특히 타겟값이 매우 불균형할 때 유용합니다.
Stratify 사용의 장단점
장점: 클래스 비율을 유지하여 훈련 및 검증 데이터셋에서 일관된 성능을 기대할 수 있습니다.
단점: 항상 극적인 성능 향상을 보장하지 않으며, 데이터셋에 따라 효과가 다를 수 있습니다.
Class_weight의 경우:
- class_weight=“balanced”: 클래스 불균형을 내부적으로 조정하여 가중치를 자동 할당합니다. 이것은 타겟 변수가 극도로 불균형할 때 모형 성능을 개선할 수 있습니다.
하지만, 특정 하이퍼파라미터 설정이 모든 경우에 유리하지 않을 수 있습니다. 경우에 따라서는 하이퍼파라미터 튜닝 없이도 기본 매개변수가 더 나은 결과를 보일 수 있습니다. 이는 데이터의 특성과 관련된 다양한 요인에 따라 달라질 수 있으므로, 여러 설정을 시도해보고 케이스별로 최적의 조합을 찾는 것이 중요합니다.
다른 하이퍼파라미터 튜닝
하이퍼파라미터 튜닝도 상황에 따라 필요할 수 있습니다. 데이터의 성격이나 문제 유형에 따라 최적의 모델 성능을 위해서는 다음과 같은 다른 튜닝 방법도 고려해야 합니다:
- Grid Search나 Random Search를 활용한 최적 매개변수 탐색
- 다양한 모델 평가 지표를 통한 성능 검토
각 설정에 대한 최종 성능은 여러 변수에 따라 달라지므로, 김민성님이 말씀하신 것처럼 시험 후기를 참고하여 다양한 시도를 통한 경험적 접근이 필요할 수도 있습니다.
더불어, 관련 링크를 통해 비슷한 주제에 대한 내용을 추가로 확인하실 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
수강 기간 연장 가능 여부 문의드립니다.
0
7
1
ols
0
9
2
2유형 작성관련 질문(일반 심화)
0
14
2
2유형 작성관련 질문
0
10
1
2유형 object컬럼 개수 다르면
0
14
2
코딩팡질문이요ㅠㅠ
0
14
2
관찰값과 기대값의 개념이 헷갈립니다.
0
12
2
작업형2 ID 컬럼 삭제 질문
0
20
2
2유형 작성관련 질문
0
12
1
memoryerror 질문
0
14
2
작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?
0
15
1
ID 삭제 필수 인가요?
0
17
3
7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문
0
15
2
3 유형 귀무가설, 대립가설
0
19
2
인코딩 관련 질문 있습니다
0
21
2
작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이
0
21
2
2유형 원핫인코딩 오류
0
22
2
시험장에서 주석 단축키 안될 때 많나요?
0
26
2
라벨인코딩 방식
0
24
2
test 재학습 관련
0
16
2
target 빈도 확인
0
17
2
작업형 2 연습문제 섹션 6
0
20
2
F1-score
0
19
2
작업형 2번 섹션 3
0
18
2

