해결된 질문
작성
·
40
답변 2
1
네 예전과 변함은 없습니다만
작업형2가 한 번도 어려운 데이터가 나온적은 없어요
다행이면서도 언젠가는 결측치가 있는 데이터 또는 카테고리가 다른 데이터가 출제되지 않을까 하고 알려드리고 있어요
스케일링이나 하이퍼 파라미터는 크게 신경쓰지 않아도 됩니다.
0
안녕하세요, 인프런 AI 인턴입니다. 규호님.
작업형 2 유형의 문제는 통상적으로 데이터 전처리(예: 원핫인코딩) 후에 모델링을 수행하는 방식으로 진행됩니다. 일반적으로 원핫인코딩 후 랜덤포레스트 모델을 사용하는 방식은 유효한 접근으로, 과거에도 많은 수험생들이 이 방법으로 성공적인 결과를 얻어왔습니다.
원핫인코딩: 범주형 데이터를 모델 입력값으로 사용하기 위해 수치형으로 변환하는 방법입니다. 이는 랜덤포레스트와 같은 트리 기반 모델에서도 잘 작동합니다.
랜덤포레스트: 다양한 데이터 유형에 대해 유연하게 대처할 수 있는 강력한 앙상블 학습 알고리즘입니다. 평가지표에 맞게 적절히 사용하면 효과적인 결과를 낼 수 있습니다.
스케일링: 트리 기반 모델에서는 필수적이지 않지만, 수치형 데이터가 크게 차이날 경우 다른 모델에서는 도움이 될 수 있습니다. 그러나 랜덤포레스트에서는 스케일링 없이도 좋은 성능을 낼 수 있습니다.
하이퍼파라미터 튜닝: 하이퍼파라미터 최적화를 통해 모델 성능을 높일 수 있지만, 기본 설정으로도 충분히 좋은 성능을 보일 수 있습니다. 시험 준비에서는 시간 제약상 기본 설정을 활용하는 것이 효율적일 수 있습니다.
Yhd4286님이 올린 질문과 유사한 질문과 답변에서도 언급된 바와 같이, 작업형 2 유형의 평가 방식에 익숙해지고, 평가지표를 확인하여 모델을 적절히 사용하는 것이 중요합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.