inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

2회 기출 작업형2 결과값

해결된 질문

100

토리

작성한 질문수 7

0

아직 강의 보기전 혼자 풀어보았을때 결과가 이런식으로 다르게 나온다면 코드에서 잘못된 부분이 있는거겠죠ㅠㅠ?

검증데이터로는 roc_auc_score 0.75 나옵니다

(오류없이 실행은 되는데 결과 확률이 다르게 나옵니다ㅠ)

image.png

 

image.png

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

0.75면 더 잘 나온 것 아닌가요? 0.5나 0.4라면 큰 문제가 있지만 전혀 문제가 없습니다.

머신러닝의 결과는 환경과 버전에 따라 달라질 수 있어요!

문제가 없어 보입니다 🙂 응원합니다.

0

인프런 AI 인턴

안녕하세요, 구희원님. 인프런 AI 인턴입니다.

질문해주신 내용은 머신러닝 모델의 예측 결과와 강의의 정답이 다르게 나오는 것에 대한 고민으로 보입니다. 아래에 비슷한 문제를 겪었던 다른 사례들을 바탕으로 설명드릴게요.

  1. 결과의 차이 가능성: 로직상 오류가 없고 roc_auc_score 가 0.75로 꽤 괜찮은 수준이라면, 단순히 결과 확률 값이 다른 것은 자연스러운 현상일 수 있습니다. 모델의 랜덤성이나 데이터 샘플링 차이 등 여러 이유로 인해 결과가 달라질 수 있습니다. 머신러닝에서는 데이터 분할이나 초기화 값에 따라 결과가 달라질 수 있기 때문입니다.

  2. 결과값 차이 원인 찾기:

    • 데이터 전처리: 데이터 전처리에 차이가 있을 수 있습니다. 스케일링 과정에서 잘못된 컬럼이 포함되거나 누락된 것은 아닌지 확인해 보세요.
    • 모델 파라미터: RandomForestClassifier의 파라미터 (예: n_estimators, max_depth, random_state)가 강의와 동일한지 확인해 보세요. random_state 설정에 따라 결과가 바뀔 수 있습니다.
    • 예측 과정: predict_proba 를 사용하실 때, [:,1] 부분이 올바르게 처리되고 있는지도 확인해 보세요. 이는 양성 클래스(즉, 1로 분류되는 클래스)의 확률을 나타내며, roc_auc_score 계산 시 정확하게 사용되어야 합니다.

비슷한 질문이 있었던 게시물을 통해 추가적인 정보를 얻으실 수도 있습니다. 예를 들면 이 게시물에서는 제출 파일 형식에 관련된 유사한 케이스를 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

110강 회귀_8번 문의

0

8

2

XGBRegressor 학습 시 warning 출력

0

11

2

데이터 프레임을 변경해도 되나요?

0

9

2

10회 기출 작업형3 문제 2-1 질문

0

14

2

작업형 2 질문

0

13

2

작업형 2 템플릿 확인 요청

0

12

2

작업형2 인코딩 질문

0

22

2

작업형 3 벼락치기 공부방법 질문

0

30

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

30

2

예측값 결과 소수점 차이

0

26

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

34

1

전처리 train() test([ ])

0

23

2

작업형 1 배경지식 질문

0

31

2

옳게 풀은건지 질문드립니다!

0

21

1

roc_auc_score

0

29

2

추가질문 합니다

0

22

2

시험환경 구름

0

19

2

2유형 질문드려요

0

20

2

RandomForest vs lgb

0

27

2

전처리 관련질문

0

29

3

작업형3 기출

0

19

2

유형2에서 데이터분할 생략 가능여부

0

32

2

9회 기출 유형3 질문

0

21

2

lgb 기초편

0

22

2