inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2025)

모의문제 작업형 2 코드 ㅠㅠㅠ 제가 작성한 코드에 어디에 문제가 있는것일까요?

해결된 질문

68

이선희

작성한 질문수 63

0

 

성능평가한 값이 선생님 결과랑 터무니없이 차이가 많이 나네요 ㅠㅠ어디가 잘못된걸까요

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 3

0

퇴근후딴짓

질문의 이유를 찾았습니다.

제가 영상에 빠르게 자막처리 할게요

랜포 800대 점수가 나오는 것이 정상입니다.

(lightgbm 700대)

 

작업형2가 새로 나오면서 주최측에서 안내 없이 데이터를 3번이나 변경하다보니 그 사이 촬영이 되어 그렇습니다.

0

퇴근후딴짓

문제 없습니다.

저는 800점대는데

지금 점수가 훨씬 좋은 점수입니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 이선희님.

작성하신 코드를 검토해보니, 기본적인 데이터 전처리 및 모델 학습 과정이 잘 구성되어 있습니다. 하지만 성능(RMSE)이 선생님 결과와 크게 차이가 나는 경우는 다음 사항들을 점검해보시면 좋을 것 같습니다.

1. 데이터 전처리 관련 사항

  • fillna로 결측치를 채우실 때, traintest에서 같은 중간값으로 채우시는 게 문제가 될 수는 없습니다만, 전체 데이터의 분포에 따라 달라질 수 있습니다. 만약 데이터 분포에 따라 너무 큰 차이가 있다면 다시 확인이 필요할 수 있습니다.
  • 범주형 데이터를 라벨 인코딩하는 과정에서, 컬럼별 유니크한 값의 범위가 traintest가 달라지지 않았는지 확인해 보십시오.

2. 모델 및 파라미터 설정

  • LGBMRegressor를 사용할 때, random_state와 기타 파라미터들이 전혀 다른 결과를 초래할 수 있습니다. 동일한 조건이 설정되었는지 확인하세요.
  • verbose=-1은 출력을 억제하지만, 학습과정의 디버그 정보가 필요하다면 다른 값을 사용하여 출력을 살펴보시는 것도 방법입니다.

3. 성능평가 방식 및 최적화

  • root_mean_squared_error 대신 mean_squared_error를 사용하고 squared=False를 설정하여 RMSE를 직접 계산하십시오.
from sklearn.metrics import mean_squared_error
rmse = mean_squared_error(y_val, pred, squared=False)
print("RMSE:", rmse)
  • 모델 학습환경: 학습한 데이터에 따라 동작의 차이가 있을 수 있습니다. 동일한 데이터셋인지, 전처리 및 학습과정이 선생님 코드와 일치하는지 꼼꼼히 비교해보세요.

추천 게시글

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형1 모의문제 4번에 3)문제 질문

0

9

1

이상치 전처리 작업

0

21

2

평가결과값 문의

0

23

2

시계열 데이터 날짜와 시간 format

0

31

2

평가지표 F1 스코어 질문드립니다.

0

24

2

작업형 2 기출7회분에서

0

36

2

작업형2 모의문제1 (30강)

0

34

2

수강 기간 연장 문의 드립니다.

0

41

2

수강 계획과 관련해 문의 드립니다.

0

27

2

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

50

2

작업형 1 -연습문제 4-6

0

38

2

작업형 1 유형 부분

0

42

2

작업형 1 (삭제예정, 구 버전)

0

51

2

수강기간 연장 문의드립니다.

0

38

2

2유형 레이블 인코딩 VS 원핫 인코딩

0

37

3

수강기간 연장 문의드립니다.

0

44

2

인덱스 슬라이싱

0

37

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

61

2

수강기간 연장 문의드립니다

0

48

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

64

2