강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

찌찌찌누님의 프로필 이미지
찌찌찌누

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

기출(작업형2) 한 가지 방법으로 풀기

기출 5회 pred값이 선생님 결과랑 달라요

해결된 질문

작성

·

42

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

pred

1 15586.88

2 15407.71

3 14912.47

4 18482.73

5 6168.01

6 16953.75

 

기출 5회 정답파일 제출 Value값인 pred가 책이랑 다른데, 이럴수가 있나요? 제출한다면 선생님꺼랑 똑같은 인덱스에 똑같은 pred값이 들어갔어야할텐데,,, random_state도 똑같이 전부 0으로 맞췄는데 이럴수가 있나요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

"아니 이럴수가!" 싶은 상황이지만, 실제로 그럴 수 있습니다.

작업형 1번과 3번 문제는 저와 결과가 다르면 '틀린 것'입니다.
정답이 정해져 있는 만큼, 결과가 일치해야 정답 처리됩니다.

하지만 작업형 2번은 다릅니다.
머신러닝 모델을 사용하기 때문에, random_state를 동일하게 설정해도 예측 결과가 완전히 같아지진 않습니다.

또한 작업형 2는 정답 자체가 예측값이 아니라 '평가지표'입니다.
즉, 제출한 모델의 예측 결과가 샘플 정답과 다르더라도, 평가지표(RMSE 등)가 40점 구간이면 문제가 없습니다. (40점 구간은 공개하지 않음)

그래서 예측값을 눈으로 하나하나 비교하기보다는, 평가지표를 확인해 주세요

저와 평가지표가 약간 다를 수는 있지만,큰 차이가 아니라면 정답 처리에 문제가 없을 거예요.

0

안녕하세요, 인프런 AI 인턴입니다. 찌찌찌누님!

여러분이 머신러닝 모델을 학습하고 예측값을 도출할 때, 강의에서 제공한 결과와 다를 수 있는 몇 가지 이유가 있습니다:

  1. 데이터 전처리 차이: 데이터 전처리가 강의 예제와 다를 경우, 모델에 들어가는 입력 데이터가 달라지면서 결과값도 달라질 수 있습니다.

  2. 모델 파라미터 차이: random_state=0과 같은 설정이 똑같더라도, 다른 모델 설정 관련 파라미터가 다를 경우 결과가 변동될 수 있습니다.

  3. 환경적 차이: 사용하는 소프트웨어 버전, 라이브러리의 버전이 강의에서와 달라질 경우 결과에 영향을 미칠 수도 있습니다.

  4. 모델 학습 과정의 차이: 같은 데이터를 사용하더라도 모델이 학습을 진행하는 과정에서 학습이 불안정했을 수도 있습니다.

유사한 질문이 존재하는지 찾아보다가 도움이 될 수 있는 몇 가지 링크를 발견했습니다:

해당 자료들을 참고하시어 현재 문제를 해결하는 데 도움이 되시기를 바랍니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

찌찌찌누님의 프로필 이미지
찌찌찌누

작성한 질문수

질문하기