inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

2회 기출 작업형2 결과값

해결된 질문

98

토리

작성한 질문수 7

0

아직 강의 보기전 혼자 풀어보았을때 결과가 이런식으로 다르게 나온다면 코드에서 잘못된 부분이 있는거겠죠ㅠㅠ?

검증데이터로는 roc_auc_score 0.75 나옵니다

(오류없이 실행은 되는데 결과 확률이 다르게 나옵니다ㅠ)

image.png

 

image.png

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

0.75면 더 잘 나온 것 아닌가요? 0.5나 0.4라면 큰 문제가 있지만 전혀 문제가 없습니다.

머신러닝의 결과는 환경과 버전에 따라 달라질 수 있어요!

문제가 없어 보입니다 🙂 응원합니다.

0

인프런 AI 인턴

안녕하세요, 구희원님. 인프런 AI 인턴입니다.

질문해주신 내용은 머신러닝 모델의 예측 결과와 강의의 정답이 다르게 나오는 것에 대한 고민으로 보입니다. 아래에 비슷한 문제를 겪었던 다른 사례들을 바탕으로 설명드릴게요.

  1. 결과의 차이 가능성: 로직상 오류가 없고 roc_auc_score 가 0.75로 꽤 괜찮은 수준이라면, 단순히 결과 확률 값이 다른 것은 자연스러운 현상일 수 있습니다. 모델의 랜덤성이나 데이터 샘플링 차이 등 여러 이유로 인해 결과가 달라질 수 있습니다. 머신러닝에서는 데이터 분할이나 초기화 값에 따라 결과가 달라질 수 있기 때문입니다.

  2. 결과값 차이 원인 찾기:

    • 데이터 전처리: 데이터 전처리에 차이가 있을 수 있습니다. 스케일링 과정에서 잘못된 컬럼이 포함되거나 누락된 것은 아닌지 확인해 보세요.
    • 모델 파라미터: RandomForestClassifier의 파라미터 (예: n_estimators, max_depth, random_state)가 강의와 동일한지 확인해 보세요. random_state 설정에 따라 결과가 바뀔 수 있습니다.
    • 예측 과정: predict_proba 를 사용하실 때, [:,1] 부분이 올바르게 처리되고 있는지도 확인해 보세요. 이는 양성 클래스(즉, 1로 분류되는 클래스)의 확률을 나타내며, roc_auc_score 계산 시 정확하게 사용되어야 합니다.

비슷한 질문이 있었던 게시물을 통해 추가적인 정보를 얻으실 수도 있습니다. 예를 들면 이 게시물에서는 제출 파일 형식에 관련된 유사한 케이스를 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형 1 유형 부분

0

9

1

작업형 1 (삭제예정, 구 버전)

0

28

2

수강기간 연장 문의드립니다.

0

21

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

22

3

수강기간 연장 문의드립니다.

0

26

1

인덱스 슬라이싱

0

27

2

질문 드립니다.

0

45

2

강의 내용 관련 질문드립니다~

0

43

2

수강 연장 문의

0

54

2

강의자료 일괄 다운로드

0

50

2

수강기간 연장 문의드립니다

0

40

2

list 문제 질문드립니다~

0

34

2

빅분기 실기 12회 재도전

0

53

2

강의 기간 연장 가능여부 검토 요청건

0

39

2

수강기간 연장 문의 드립니다

0

43

2

수강기간 연장 문의드립니다

0

50

2

질문이요

0

56

2

수강기간 연장 문의드립니다.

0

58

2

문제 3-2 질문드립니다

0

47

2

수강기간 연장 문의 드립니다.

0

61

2

변수, 칼럼 , df 구분

0

51

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

49

2

수강기간 연장 문의드립니다.

0

42

2