inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

9회 기출유형(작업형2)

기출 9회 작업형2 질문

해결된 질문

65

Jin

작성한 질문수 22

0

제가 시험장에서 코드가 생각이 안 날 가능성을 대비해서, 작업형2는 우선 한 가지 방법으로 풀고 거기에 살을 붙여가며 연습하려 합니다.

근데 여기서 든 생각이, 어차피 RandomForest 한 가지 방법으로 풀 거면 모델 성능 측정은 모델 간의 성능을 비교할 목적이니 굳이 안 해도 될 것 같고, 성능 측정을 하지 않는다면 train과 validation을 나눠주는 train_test_split도 굳이 안 해도 될 것 같고, 결론적으로는 경우에 따라 Classifier/Regressor만 맞게 써준다면 아래의 코드만으로도 웬만한 문제는 감점당하지 않고 넘어갈 수 있지 않나 하는 생각이 들었습니다.

target = train.pop('농약검출여부')
train = pd.get_dummies(train)
test = pd.get_dummies(test)
test = test.reindex(columns=train.columns, fill_value=0)

from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(random_state=0)
model.fit(train, target)

pred = model.predict(test)
pd.DataFrame({'pred': pred}).to_csv('result.csv', index=False)
pd.read_csv('result.csv')

강사님께서 올려주신 실기 응시 가이드를 보니 성능이 너무 낮지만 않다면 점수가 많이 까일 가능성은 낮아보여서, 우선은 이걸로 밀고 가면서 최소한의 점수는 확보하려는데, 그러한 목적으로는 이 코드가 문제가 없을지 궁금합니다.

감사합니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

정확합니다. 회귀와 분류만 구분 잘하면 됩니다.

평가 지표를 사용한다는 기준은 결측치도 나오고해야

결측치 처리를 비교해 보기도 하고 모델도 비교해 보기도 합니다.

다만 분류는 2가지 케이스로 나눠야해서. 결론, 총 3가지 케이스로 준비해야 합니다.

아래 영상 한번 봐주세요

7. [빅이시] 빅데이터 분석기사 이제 시작 과정 (단기 준비자 또는 복습용)

0

Jin

아 이런 영상이 있는 줄 몰랐네요 ㅜㅜ 감사합니다!

0

퇴근후딴짓

화이팅!!

기출 11회 작업형 2_전체 데이터 학습 여부

0

13

1

예측값 결과 소수점 차이

0

17

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

14

0

전처리 train() test([ ])

0

15

2

작업형 1 배경지식 질문

0

19

2

옳게 풀은건지 질문드립니다!

0

14

1

roc_auc_score

0

22

2

추가질문 합니다

0

16

2

시험환경 구름

0

18

2

2유형 질문드려요

0

15

2

RandomForest vs lgb

0

23

2

전처리 관련질문

0

23

3

작업형3 기출

0

17

2

유형2에서 데이터분할 생략 가능여부

0

28

2

9회 기출 유형3 질문

0

19

2

lgb 기초편

0

13

1

괄호 사용

0

23

2

작업형 2 데이터 전처리 질문

0

21

1

11회 기출 유형 작업형1 문제 3-1

0

19

1

예시문제 작업형2 (ver2023) 질문입니다

0

20

2

Data type에 따른 처리

0

20

2

데이터 전처리 관련

0

18

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

25

2