inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제1

작업형2모의문제1 / 평가 (predict/predict_proba)질문

해결된 질문

360

duddl

작성한 질문수 7

0

안녕하세요. 작업형2 모의문제1에서 평가 시

roc_auc_score를 쓸 때는 predict_proba와,

roc_auc_score(y_val, pred[:,1])형태를,

 

나머지 평가 방법을 쓸 때는 predict와

(y_val, pred)형태를 쓰시던데요!!

 

문제에서 신용카드 이탈 확률을 찾는거라 predict_proba라고 생각했는데,

그냥 predict를 쓰는 것은 평가 방법 때문인가요? (일단 roc제외한 평가에는 predict를 쓰고 마지막 제출 시 proba로 다시 예측하는건지?)

 

 

  1. 수치형 컬럼 전처리에서

    col=['age', 'bmi', 'children'] <-수치형 컬럼나열

    from sklearn.preprocessing StandardScaler

    scaler=StandardScaler

    train[col]=scaler.fit_transform(train[col])

    test[col]=scaler.transform(test[col])형태로 전처리를 하면

    keyError: "None of [Index(['age', 'bmi', 'children'], dtype='object')] are in the [index]"

이런 에러가 자꾸 발생하는데 어디가 잘못된건지 궁금합니다!!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

  1. 확률을 묻는 문제라 predict_proba가 맞습니다 !!

    다만 다른 평가 지표도 보여주기 위해 함께 사용했어요!!

  2. train과 test 데이터프레임에 ['age', 'bmi', 'children'] 중 없는 컬럼이 있나요?

    train과 test를 출력해 눈으로 확인해주세요!

0

duddl

감사합니다~~!

평가지표 F1 스코어 질문드립니다.

0

9

2

작업형 2 기출7회분에서

0

23

2

작업형2 모의문제1 (30강)

0

25

2

수강 기간 연장 문의 드립니다.

0

31

2

수강 계획과 관련해 문의 드립니다.

0

26

2

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

49

2

작업형 1 -연습문제 4-6

0

35

2

작업형 1 유형 부분

0

42

2

작업형 1 (삭제예정, 구 버전)

0

51

2

수강기간 연장 문의드립니다.

0

37

2

2유형 레이블 인코딩 VS 원핫 인코딩

0

37

3

수강기간 연장 문의드립니다.

0

44

2

인덱스 슬라이싱

0

36

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

58

2

수강기간 연장 문의드립니다

0

48

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

63

2

강의 기간 연장 가능여부 검토 요청건

0

51

2

수강기간 연장 문의 드립니다

0

46

2

수강기간 연장 문의드립니다

0

52

2

질문이요

0

57

2