검증데이터 분할 할 때 test_size 그리고 머신러닝 분류모델 종류
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
- 먼저 유사한 질문이 있었는지 검색해보세요
- 검증데이터 분할 할 때 test_size를 나누는 꿀팁있을까요? 0.1? 0.15? 0.2?
- 머신러닝 모델을 탁 찝어서 이거써라~하고 문제가 나온적도 있나요?
답변 2
1
안녕하세요, 인프런 AI 인턴입니다.
wanzy123님의 질문에 대해 유사한 내용을 다룬 기존 답변을 찾았습니다. 이 내용들이 귀하의 질문에 일부 답변이 될 수 있을 것 같습니다.
검증데이터 분할에 대해서는, 검증 데이터의 비율(test_size) 설정은 분석하려는 데이터의 크기, 모델의 복잡도, 그리고 실험의 목적에 따라 달라질 수 있습니다. 일반적으로 0.2~0.3 범위를 사용하는 것이 일반적입니다. 하지만 빅데이터 분석기사 (2회): 기출유형-작업형2 질문에서도 언급되었듯이, 전체 데이터 수가 작으면 검증 데이터를 작게 가져가려고 하며, 정확한 비율은 시험 데이터 수나 특정 상황에 따라 조정될 수 있어 정해진 규칙은 없습니다.
머신러닝 모델 선택에 관한 질문에 대해서는, 특정 문제에 최적의 모델을 “이거써라”고 지정하기보다는 문제의 종류(분류, 회귀), 데이터의 특성, 그리고 기대하는 결과에 따라 적절한 모델을 선택하는 것이 중요합니다. 예를 들어, “작업형2 모의문제3”에서는 모델 선택 기준에 대한 통찰을 제공합니다. 분류와 회귀 문제를 구분하고 각 문제에 적합한 모델을 선택하는 것이 중요하며, 타겟 변수 또는 평가 지표에 따라 분류 모형이나 예측모형을 선택할 수 있습니다.
위에서 언급된 정보는 질문자님이 질문하신 검증 데이터 분할 및 머신러닝 모델 선택에 관한 결정을 하는 데 도움이 될 수 있습니다. 데이터의 크기, 문제의 종류, 그리고 특정 시나리오에 맞는 모델을 고려하는 것이 중요합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
제2유형 질문입니다.
0
12
1
C()
0
9
1
작업형 2에서 strafity 적용 유무
0
15
2
수강 기간 연장 가능 여부 문의드립니다.
0
14
1
ols
0
12
2
2유형 작성관련 질문(일반 심화)
0
17
2
2유형 작성관련 질문
0
16
2
2유형 object컬럼 개수 다르면
0
18
2
코딩팡질문이요ㅠㅠ
0
19
2
관찰값과 기대값의 개념이 헷갈립니다.
0
12
2
작업형2 ID 컬럼 삭제 질문
0
22
2
2유형 작성관련 질문
0
19
2
memoryerror 질문
0
16
2
작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?
0
19
1
ID 삭제 필수 인가요?
0
19
3
7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문
0
15
2
3 유형 귀무가설, 대립가설
0
19
2
인코딩 관련 질문 있습니다
0
23
2
작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이
0
26
2
2유형 원핫인코딩 오류
0
23
2
시험장에서 주석 단축키 안될 때 많나요?
0
28
2
라벨인코딩 방식
0
27
2
test 재학습 관련
0
16
2
target 빈도 확인
0
18
2





