inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

유형2 채점기준 관련

해결된 질문

1176

루나킹

작성한 질문수 5

0

안녕하세요 강사님,

오늘 빅분기 6회 실기 시험을 치르고 나왔는데요 (생각보다 어려웠네요 ㅠ)

 

빅데이터 분석기사 2유형의 0점유형에

'예측값 정확도가 평가지표 최저 구간 미만 : 0점' 이라고 적혀있는데,

'평가지표 최저 구간'이라는 의미가 어떻게 되는지 알 수 있을까요?

 

분류 문제가 나와서 처음에는 RandomForestClassifier로 예측했고,

요구하는 평가지표(f1-macro)로 돌려봤더니 train 데이터에서 분리(train_test_split)한

validation 데이터 0.9이상이 나와서 과적합인 것 같아서

강사님께서 얼마전 알려주신 lightgbm으로 바꾼 다음에 하이퍼파라미터 수정해보니

0.8정도 나와서 분류 예측 후 제출하였습니다.

 

그런데 빅데이터 관련 카페 글 보니, 대부분 랜포로 돌린다음에 0.9이상인 상태에서

분류 후 제출했다고 하네요 

그러면서 빅데이터 카페에 어떤 분이 train 데이터에서 분리한 train 과 validation 데이터

모두 평가지표가 높게 나오면 과적합이 아니라는 얘기를 들었습니다...ㅠ

 

평가지표 최저 구간이라는 의미가 각 모델의 하이퍼파라미터를 건드리지 않고

그냥 모델을 예측했을 때의 평가지표 일까요? (예를 들면 LGBMClassifier의 하이퍼파라미터 없는 상태에서 0.9면 기준이 0.9가 되는건지...)

이게 맞다면 저는 0점이겠네요..ㅠ, lightgbm도 아무런 하이퍼파라미터 없이는 0.9이상이였거든요..

 

무튼, 덕분에 많은 것들 배울 수 있어서 감사했습니다!

 

+글 작성후 추가

구글 Bard 한테 물어봤더니... train, validation 데이터 모두 0.9 이상 인 경우 과적합으로 볼 수 있냐는 질문을 했더니 아래와 같이 답변이 나오기는 했네요..

<답변>

네, train 데이터와 validation 데이터 모두 해당 모델에 대한 평가지표가 0.9인 경우에도 과적합이 발생할 가능성이 있습니다. 과적합은 모델의 복잡성이 너무 높아서 train 데이터에만 적응하는 상태를 말합니다. train 데이터와 validation 데이터 모두 해당 모델에 대한 평가지표가 높다는 것은 모델이 train 데이터에 너무 적응하여 그 외의 데이터에는 제대로 대응하지 못하는 상태일 가능성이 높습니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

일반적으로 과적합을 이야기 할 때는 Train 점수는 좋아지고 validation점수는 올랐다 점점 떨어지기 시작하면 오버피팅(과대적합)이라고 이야기 합니다.

따라서 지금 말씀해준 것만으로는 과대적합 되었다고 판단하긴 어려울 것 같아요!!

평가지표 최저 구간이라는 것은 자체적으로 정한 기준입니다.

루나킹님이 제작한 모델로 평가하는 것이 아니라 예측한 csv로 평가를 합니다.

해당 csv파일을 f1-score로 평가 했을 때 출제자 측의 기준 즉 만약 0.7이 최저라면 이 이하는 0점 처리된다는 말입니다:)

오늘 시험 본다고 너무 고생많으셨어요~~ :)

 

수업노트가 어디에 있나요?

0

5

1

실기시험 제출관련

0

137

2

6.20 작업형 2 과적합

0

146

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

47

2

로지스틱회귀, 회귀

0

47

2

회귀 문제를 풀때 질문입니다.

0

53

1

불균형 처리 후 성능이 더 낮아졌다면,

0

61

2

실기 체험 제2유형 에러 문의

0

60

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

47

2

3번문제 등분산 가정

0

46

2

작업형3 target 형 변환 질문

0

34

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

36

3

원핫인코딩과 레이블 인코딩에서 concat

0

57

2

제2유형 질문입니다.

0

46

2

C()

0

44

2

작업형 2에서 strafity 적용 유무

0

50

2

수강 기간 연장 가능 여부 문의드립니다.

0

59

1

ols

0

43

2

2유형 작성관련 질문(일반 심화)

0

39

2

2유형 작성관련 질문

0

39

2

2유형 object컬럼 개수 다르면

0

48

2

코딩팡질문이요ㅠㅠ

0

45

2

관찰값과 기대값의 개념이 헷갈립니다.

0

25

2

작업형2 ID 컬럼 삭제 질문

0

45

2