강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

xacodud님의 프로필 이미지
xacodud

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

3회 기출유형(작업형2)

답이 다른 것 같아요

해결된 질문

작성

·

15

0

496개인건 동일한데, pred 값이 좀 다른 것 같아요..

image.png

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

작업형1과 3은 정답이 있는 문제!!

 

작업형2는 평가지표로 계산을 해요! 그 결과가 40점 구간에 있는지만 확인합니다.

개별 예측값 비교는 큰 의미가 없어요! 평가지표 점수를 봐야합니다 🙂

0

안녕하세요, 인프런 AI 인턴입니다. xacodud님.

질문에서 언급하신 부분과 관련하여, 데이터프레임에서 pred 값이 예상과 다르게 나타나는 경우는 여러 가지 원인으로 발생할 수 있습니다. 각 단계에서 데이터를 어떻게 처리하고 있는지 확인하는 것이 중요합니다. 일반적인 차이 발생 원인은 다음과 같습니다:

  1. CSV 파일 읽기: pd.read_csv("1111.csv") 을 통해 데이터를 읽어들일 때, 파일 경로나 파일의 구조에서 의도치 않은 차이가 있을 수 있습니다. 파일이 제대로 로드되었는지 확인하는 것이 중요합니다.

  2. 데이터 전처리 과정: 코드 상에서 데이터셋을 필터링하거나 값들을 변환하는 과정에서 오류가 있을 수 있습니다. y_pred 컬럼의 값을 계산하거나 대입하는 코드가 잘못되었는지 확인해 보세요.

  3. 파라미터 설정: 머신러닝 모델에서 파라미터 설정이 다르면 예측 결과가 달라질 수 있습니다. 학습에 사용된 모델 파라미터가 동일한지 확인해 보세요.

  4. 훈련 데이터와 테스트 데이터 구분: 같은 데이터 파일을 테스트와 학습에 혼용하고 있을 수 있습니다. 예측 결과는 일반적으로 테스트 데이터셋에 대해 계산되므로, 데이터 분할이 올바르게 이루어졌는지를 확인해야 합니다.

이미지를 통해 질문하시고 싶은 사항이 있을 것으로 예상되지만, 제공된 이미지 파일에서 핵심 이슈를 구체적으로 확인하기 어렵습니다. 데이터프레임을 조회한 결과와, 이를 생성하는 과정에서 사용했던 주요 코드를 제공해 주시면 보다 정확한 도움을 드릴 수 있습니다.

추가적으로, 유사한 질문에 대해 도움이 될 만한 게시글 링크를 제공합니다:

이 게시글에서는 데이터 처리를 위해 필요한 여러 가지 방법론들이 제시되어 있습니다. 문제 해결에 도움이 되길 바랍니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

xacodud님의 프로필 이미지
xacodud

작성한 질문수

질문하기