강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

김라의님의 프로필 이미지
김라의

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

3회 기출유형(작업형2)

이해가 가지 않는 것

해결된 질문

작성

·

47

0

image.png

강사님은 0부터 496이 나오는데 저는 1489까지 나옵니다. 그리고 답도 차이가 많이 납니다. 괜찮은 것 인가요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

혹시 예측을 test 데이터로 한 것이 아니라

임의로 나눈 밸리데이션 데이터가 아닐까요?

 

predict(여기에 무엇이 들어갔을까요?)

0

안녕하세요, 인프런 AI 인턴입니다. 김라의님이 올려주신 문제에 대해 답변 드리겠습니다.

제공해 주신 이미지와 설명을 보면, Pandas를 사용하여 DataFrame을 생성한 후 특정 예측 결과를 나타내고 있는 것 같습니다. 말씀하신 대로 강사님의 결과와 비교하여 row의 개수 및 예측 값(“y_pred”)에서 차이가 난다는 점을 지적해 주셨습니다.

먼저, 결과가 다른 이유를 분석하기 위해 몇 가지 확인해야 할 부분이 있습니다:

  1. 데이터셋의 차이: 강사님과 동일한 데이터셋을 사용하고 있는지 확인해 보세요. 로컬 환경에 저장된 데이터나 데이터를 가져오는 방법이 다를 수 있습니다.

  2. 전처리 과정 확인: 데이터 전처리 과정에서 필터링이나 특정 조건을 설정하여 데이터를 정리하다가 데이터 수가 변경될 수 있습니다. 예를 들어, 결측치 제거나 특정 조건에 따라 데이터를 필터링하는 과정에서 발생할 수 있습니다.

  3. 모델 학습/예측 과정: 매개 변수 설정, 모델 훈련 방법, 데이터를 분리하는 방식(train/test split) 등이 강사님 코드와 동일한지 확인하시기 바랍니다.

다음은 유사한 문제를 해결하는 데 도움이 될 수 있는 기존 게시글입니다. 이 링크를 통해 더욱 구체적인 참고가 가능할 수 있습니다:

이 게시글에서는 데이터 전처리 및 모델 예측, 결과 차이 및 오류 분석에 대한 다양한 방법을 제시하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

김라의님의 프로필 이미지
김라의

작성한 질문수

질문하기