inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의문제3

test_size를 조절하니 pred_proba와 test_id 개수가 맞춰졌습니다

해결된 질문

402

승찬

작성한 질문수 1

0

  1. 랜덤포레스트로 단순하게 테스트사이즈를 0.2로 하고 진행했더니 행의 개수가 달라지더라고요! 그래서 계속 오류가 발생했는데 테스트 사이즈를 조절하다 0.25로 하니 61개로 딱 맞아서 답이 출력되네요!

왜 그런지 혹시 이유가 있을까요?

  1. 사진과 같이 roc로하면 확률이 나오는데 단순하게 pred로 하면 확률이 아닌 0 과1로 출력이 됩니다. 원래 이렇게 나오는건지 궁금하고 문제에서는 roc로 csv를 구하라는건지 궁금합니다. 감사합니다!화면 캡처 2023-12-01 223450.jpg

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

승찬

삭제된 글입니다

1

퇴근후딴짓

1번 문제는 다시 읽어 보니 무엇을 보고 말하는 건지 모르겠습니다. 에러 상황의 코드와 에러를 보여주시겠어요??

2번

predict과 predict_proba의 차이입니다. roc-auc를 평가지표로 할때만predict_proba를 사용해주세요

 

코드보면 검증데이터에서는 predict_proba를 사용했고

테스터 데이터에서는 predict를 사용했어요

우선 강의를 어디까지 따라 해보셨을까요? 아직 패턴이 익숙하지 않은 것 같아요 😭

0

퇴근후딴짓

큰 실수를 하고 있는 것 같습니다.

검증용 데이터를 절대 제출용으로 사용하면 안됩니다. 0점 처리됨

테스트 데이터를 예측하고 그 결과값을 제출해야 합니다.

0

승찬

검증용데이터를 업로드 하지 않았는데 사용이 가능한가요? 어디서 꼬인지 잘 모르겠어요ㅠㅠ

일단 pred가 아닌 pred_proba로 예측하면 정상적으로 답이 나옵니다!

0

승찬

1.jpg문제를 roc-auc를 사용하니 에러없이 정상적으로 나왔습니다!

제가 해보고 싶은건 accuracy나 f1으로 'output' 의 value값으로 해보고 싶었던건데 이 부분이 확률로 나오는게 아닌 pred를 찍어본것처럼 0과 1로 출력이 되어서 그 부분이 궁금합니다!

1

퇴근후딴짓

네 0 1로 나오는게 정상입니다 . pred값으로 f1 스코어를 평가하면됩니다.

0

퇴근후딴짓

당장 오늘이 시험이므로 평가지표 1개만 다루는 기출6, 5, 4… 순으로 로 학습하시고,

똑같이 따라서 학습해주세요!

꼬인것을 풀면서 할 시간은 없을 같아요

작업형2 모의문제1 (30강)

0

18

1

수강 기간 연장 문의 드립니다.

0

21

1

수강 계획과 관련해 문의 드립니다.

0

19

1

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

44

2

작업형 1 -연습문제 4-6

0

32

2

작업형 1 유형 부분

0

39

2

작업형 1 (삭제예정, 구 버전)

0

50

2

수강기간 연장 문의드립니다.

0

35

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

36

3

수강기간 연장 문의드립니다.

0

38

1

인덱스 슬라이싱

0

35

2

질문 드립니다.

0

49

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

58

2

수강기간 연장 문의드립니다

0

47

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

62

2

강의 기간 연장 가능여부 검토 요청건

0

49

2

수강기간 연장 문의 드립니다

0

45

2

수강기간 연장 문의드립니다

0

52

2

질문이요

0

57

2

수강기간 연장 문의드립니다.

0

60

2

문제 3-2 질문드립니다

0

47

2