강의

멘토링

로드맵

인프런 커뮤니티 질문&답변

yhjang님의 프로필 이미지
yhjang

작성한 질문수

작업형2(재질문 - 죄송합니다)

작성

·

27

·

수정됨

0

네, 데이터를 나누지 않고 전체데이터를 학습하고, 평가지표 검정 없이 test 예측결과를 바로 제출해도됩니다. 회귀와 분류만 틀리지 않으면 큰 문제는 없습니다.

===========답변해주셔서 너무 감사합니다.

근데 죄송하지만 답변 보고 더 모르겠어서 부득이 재질문드려요...ㅠㅠ

저는 아래와 같이 6번에서 평가지표 점정만 빼도 될지를 여쭤봤던건데

아래와 같이 해도 40점을 받을 수 있을까요.. 한번 더 여쭤봐서 번거롭게 해 죄송해요.


3. EDA

4. 전처리

target = train.pop('열이름')

 

print(train.shape, test.shape)

train = pd.get_dummies(train)

test = pd.get_dummies(test)

print(train.shape, test.shape)

 

5. 분할

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)

print(X_tr.shape, X_val.shape, y_tr.shape, y_val.shape)

 

6. 학습

from sklearn.ensemble import RandomForestClassifier #분류 // # 회귀: RandomForestRegressor

rf = RandomForestClassifier(random_state=0)

rf.fit(X_tr, y_tr)

pred = rf.predict(X_val)

 

7.예측

pred = rf.predict(test)

submit = pd.DataFrame({'pred':pred[:,1]})

submit.to_csv("result.csv", index=False)

==============================================
작업형2 한가지로만 푸는 것이 7회까지만 되어 있는데

8회 작업형 2도 위와 같이 쭉 진행해보면

 MAE가 946.9158838362998로 강의보다 오히려 줄어드는 것 같습니다.

답변

답변을 기다리고 있는 질문이에요
첫번째 답변을 남겨보세요!
yhjang님의 프로필 이미지
yhjang

작성한 질문수

질문하기