강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

taesan3228님의 프로필 이미지
taesan3228

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

9회 기출유형(작업형3)

9회 기출 작업형3 문제 1-3

해결된 질문

작성

·

36

0

  •  

    image.png

    강의시간 16:46

     

  • 따로 test["design"]에 안넣고 변수로 지정하여서 예측을 진행한 후 rmse계산을 하였는데 결과가 다르게 나온 이유가 무엇일까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

테스트 해봤는데 똑같이 나옵니다.

빈칸 말고 풀이가 있는 코드로

mean_squared_error(design_ex, test["design"])**0.5

만 대입해 보세요 !

아마 그 전에 어떤 처리가 차이가 있는 것 같아요!

0

안녕하세요, 인프런 AI 인턴입니다. taesan3228님께서 올려주신 질문에 대해 답변드리겠습니다.

현재 질문 내용을 기반으로 설명드리자면, ols를 사용하여 선형 회귀 모델을 만들고, 테스트 데이터로 예측한 결과와 실제 값에 대한 RMSE를 계산할 때 발생하는 차이에 대한 문제를 해결하고자 하시는 것 같습니다.

우선적으로 검토해봐야 할 몇 가지 사항들을 나열하겠습니다:

  1. 데이터 정리:

    • test["design"]를 사용하는 대신 변수로 지정하셨다면, 사용한 변수에 정확한 예측 대상이 저장되었는지 확인이 필요합니다. 잘못된 데이터가 RMSE 계산에 포함되었다면, 엉뚱한 결과가 나올 가능성이 있습니다.
  2. 데이터 일관성:

    • train 데이터와 test 데이터에서 사용하는 컬럼들이 일치해야 합니다. 이를 확인하기 위해 결측치 또는 누락된 데이터가 있는지 검토하세요.
  3. RMSE 계산:

    • RMSE가 올바르게 계산되었는지를 확인하세요. mean_squared_error 함수를 사용할 때는 squared=False 옵션을 설정하여 RMSE 값을 바로 계산할 수 있습니다.
  4. 예측 및 결과 비교:

    • 예측한 값이 실제 값(test data의 ‘design’ 컬럼)과 올바르게 비교되었는지 확인해 보세요. 만약 값이 누락되거나 다른 인덱스를 참조했다면 차이가 발생할 수 있습니다.

기존 질문과 유사한 문제를 다룬 게시물 2개를 소개해 드리겠습니다:
- 5회 기출유형 (작업형2) 강의 코드 질문: 이 게시글에서는 오류가 난 경우에 대한 데이터 검토와 RMSE를 포함한 성능 평가 지표의 사용 방법에 대해 논의됩니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

taesan3228님의 프로필 이미지
taesan3228

작성한 질문수

질문하기