강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

규호님의 프로필 이미지
규호

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 2 유형 한가지 풀이 질문

해결된 질문

작성

·

40

0

안녕하세요 선생님, 9회차에서 50점으로 아쉽게 떨어지고 재수강중인 학생입니다

다름이 아니라 작년 시험에서 기억이 잘 안나는데 제가 작업형 2 유형을

원핫인코딩 - 랜덤포레스트 한가지로 통일해서 연습해서 9회차 시험에서도 그렇게 했던 기억이 있는데요

물론 그 때 작업형 2 유형을 40점을 맞았지만

뭔가 불안해서 한 번 이렇게 여쭤보게 되었습니다.

작업형 2 유형은 그냥 원핫인코딩 - 랜덤포레스트 기준으로 평가지표에 맞게만 하면 되겠죠...? 스케일링이나 하이퍼 파라미터 사용 없이? 😥😥

답변 2

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 예전과 변함은 없습니다만

작업형2가 한 번도 어려운 데이터가 나온적은 없어요

다행이면서도 언젠가는 결측치가 있는 데이터 또는 카테고리가 다른 데이터가 출제되지 않을까 하고 알려드리고 있어요

 

스케일링이나 하이퍼 파라미터는 크게 신경쓰지 않아도 됩니다.

0

안녕하세요, 인프런 AI 인턴입니다. 규호님.

작업형 2 유형의 문제는 통상적으로 데이터 전처리(예: 원핫인코딩) 후에 모델링을 수행하는 방식으로 진행됩니다. 일반적으로 원핫인코딩 후 랜덤포레스트 모델을 사용하는 방식은 유효한 접근으로, 과거에도 많은 수험생들이 이 방법으로 성공적인 결과를 얻어왔습니다.

  • 원핫인코딩: 범주형 데이터를 모델 입력값으로 사용하기 위해 수치형으로 변환하는 방법입니다. 이는 랜덤포레스트와 같은 트리 기반 모델에서도 잘 작동합니다.

  • 랜덤포레스트: 다양한 데이터 유형에 대해 유연하게 대처할 수 있는 강력한 앙상블 학습 알고리즘입니다. 평가지표에 맞게 적절히 사용하면 효과적인 결과를 낼 수 있습니다.

  • 스케일링: 트리 기반 모델에서는 필수적이지 않지만, 수치형 데이터가 크게 차이날 경우 다른 모델에서는 도움이 될 수 있습니다. 그러나 랜덤포레스트에서는 스케일링 없이도 좋은 성능을 낼 수 있습니다.

  • 하이퍼파라미터 튜닝: 하이퍼파라미터 최적화를 통해 모델 성능을 높일 수 있지만, 기본 설정으로도 충분히 좋은 성능을 보일 수 있습니다. 시험 준비에서는 시간 제약상 기본 설정을 활용하는 것이 효율적일 수 있습니다.

Yhd4286님이 올린 질문과 유사한 질문과 답변에서도 언급된 바와 같이, 작업형 2 유형의 평가 방식에 익숙해지고, 평가지표를 확인하여 모델을 적절히 사용하는 것이 중요합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

규호님의 프로필 이미지
규호

작성한 질문수

질문하기