강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

ryj0330님의 프로필 이미지
ryj0330

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

머신러닝 학습 및 평가

해결된 질문

작성

·

12

0

기출 5회 제 2유형을 풀고 있는데요, 모델 성능의 평가 기준이 RMSE라고 되어 있어, from sklearn.metrics import root_mean_squared_error 을 import 하더라고요, 실제 시험장에서도 이 코드까지 제출해야하는건가요? 아니면 단순히 제출후에 모델 성능을 따로 판별할 수 없어서 혼자 모델성능을 비교해보기 위해, 이렇게 import를 하는건지 궁금합니다!

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

수능으로 비유하자면, 제가 스스로 채점하는 모의고사 같은 거예요. 실제 수능 점수와 직접 연결되진 않지만, "내 실력이 이 정도구나"를 확인할 수 있죠. 다만 전국 평균이나 순위는 모르니 정확한 위치 파악은 어렵습니다.

다양한 모델을 비교하고, 결측치 처리 방식을 바꿔가며 테스트하고, 인코딩 방법도 여러 가지로 실험해보는 과정이에요. 모두 최종 제출을 위한 준비 작업입니다. 🙂

rmse로 자체 검증을 하지 않아도 아무런 문제 없습니다.

0

안녕하세요, 인프런 AI 인턴입니다. ryj0330님, 질문해주신 내용과 유사한 답변을 찾아보았습니다.

기출 문제에서 RMSE를 평가 지표로 제시한 경우, 실제 시험장에서도 RMSE를 구현하여 성능을 평가할 수 있도록 준비하는 것이 좋습니다. from sklearn.metrics import mean_squared_error를 사용하면 쉽게 RMSE를 계산할 수 있습니다. 시험장에서도 이 코드를 사용하여 모델 성능을 내부적으로 평가할 수 있으며, 최종 제출 파일에는 RMSE 계산 코드가 포함될 필요는 없지만, 모델의 성능을 사전에 확인하고 싶은 경우에는 사용하는 것이 좋습니다.

실제 시험에서는 제출하는 CSV 파일에 대해 평가가 이루어지므로, 내부적으로 어떤 메트릭을 사용하여 모델을 평가하고 개선하는지는 응시자의 선택입니다. 하지만 모델의 성능을 잘 파악하고 개선하기 위해서는 다양한 평가 지표를 출력하며 실험하는 것이 바람직합니다.

관련된 추가적인 정보와 유사한 질문을 해결한 기존 답변도 참고하실 수 있습니다:
- “작업형2 모델 선택 질문 드립니다.”: 다양한 모델의 RMSE 및 기타 메트릭 활용에 대한 답변.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

ryj0330님의 프로필 이미지
ryj0330

작성한 질문수

질문하기