강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

Jin님의 프로필 이미지
Jin

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

9회 기출유형(작업형2)

기출 9회 작업형2 질문

해결된 질문

작성

·

28

0

제가 시험장에서 코드가 생각이 안 날 가능성을 대비해서, 작업형2는 우선 한 가지 방법으로 풀고 거기에 살을 붙여가며 연습하려 합니다.

근데 여기서 든 생각이, 어차피 RandomForest 한 가지 방법으로 풀 거면 모델 성능 측정은 모델 간의 성능을 비교할 목적이니 굳이 안 해도 될 것 같고, 성능 측정을 하지 않는다면 train과 validation을 나눠주는 train_test_split도 굳이 안 해도 될 것 같고, 결론적으로는 경우에 따라 Classifier/Regressor만 맞게 써준다면 아래의 코드만으로도 웬만한 문제는 감점당하지 않고 넘어갈 수 있지 않나 하는 생각이 들었습니다.

target = train.pop('농약검출여부')
train = pd.get_dummies(train)
test = pd.get_dummies(test)
test = test.reindex(columns=train.columns, fill_value=0)

from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(random_state=0)
model.fit(train, target)

pred = model.predict(test)
pd.DataFrame({'pred': pred}).to_csv('result.csv', index=False)
pd.read_csv('result.csv')

강사님께서 올려주신 실기 응시 가이드를 보니 성능이 너무 낮지만 않다면 점수가 많이 까일 가능성은 낮아보여서, 우선은 이걸로 밀고 가면서 최소한의 점수는 확보하려는데, 그러한 목적으로는 이 코드가 문제가 없을지 궁금합니다.

감사합니다.

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

정확합니다. 회귀와 분류만 구분 잘하면 됩니다.

평가 지표를 사용한다는 기준은 결측치도 나오고해야

결측치 처리를 비교해 보기도 하고 모델도 비교해 보기도 합니다.

다만 분류는 2가지 케이스로 나눠야해서. 결론, 총 3가지 케이스로 준비해야 합니다.

아래 영상 한번 봐주세요

7. [빅이시] 빅데이터 분석기사 이제 시작 과정 (단기 준비자 또는 복습용)

Jin님의 프로필 이미지
Jin
질문자

아 이런 영상이 있는 줄 몰랐네요 ㅜㅜ 감사합니다!

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

화이팅!!

Jin님의 프로필 이미지
Jin

작성한 질문수

질문하기