ndarray로 바뀐 사유가 궁금합니다..
Labels in y_true and y_pred should be of the same type. Got y_true=[0 1] and y_pred=['0' '1']. Make sure that the predictions provided by the classifier coincides with the true labels.
이런 문장이 뜨던데 accuracy_score(ans, pred) 중 pred가 numpy.ndarray 배열이 된 것 같거든요..
잘 따라한 것 같은데 선생님이 한건 바로 accuracy_score를 바로 볼 수 있고, 제거는 못보여 지네요..
pd.DataFrame(pred) 사용해서 해결하긴 했는데,, numpy배열로 바뀐 사유가 궁금합니다.
y_train['income'] = y_train['income'].str.replace(">50K", '1')
y_train['income'] = y_train['income'].str.replace("<=50K", '0')
y_train['income'].astype(int)from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier()
rf.fit(X_train[list], target)
pred = rf.predict(X_test[list])
submit = pd.DataFrame(
{
'id' : X_test['id'],
'income' : pred
}
)
submit.to_csv("1111.csv", index = False)
y_test.head()
(y_test['income']=='>50K').astype(int)from sklearn.metrics import accuracy_score
y_test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p2/data_atype_y/y_test.csv")
ans = (y_test['income'] == '>50K').astype(int)
pred = pred.astype(int)
accuracy_score(ans, pred)
답변 1
0
원래 pred는 ndarray가 맞습니다.
이를 데이터프레임으로 변환하는 코드를 통해서 데이터프레임으로 보이는 것이에요
submit = pd.DataFrame( { 'id' : X_test['id'], 'income' : pred } )
작업형 1 유형 부분
0
9
1
작업형 1 (삭제예정, 구 버전)
0
28
2
수강기간 연장 문의드립니다.
0
21
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
23
3
수강기간 연장 문의드립니다.
0
26
1
인덱스 슬라이싱
0
27
2
질문 드립니다.
0
45
2
강의 내용 관련 질문드립니다~
0
43
2
수강 연장 문의
0
54
2
강의자료 일괄 다운로드
0
50
2
수강기간 연장 문의드립니다
0
40
2
list 문제 질문드립니다~
0
35
2
빅분기 실기 12회 재도전
0
53
2
강의 기간 연장 가능여부 검토 요청건
0
39
2
수강기간 연장 문의 드립니다
0
43
2
수강기간 연장 문의드립니다
0
50
2
질문이요
0
56
2
수강기간 연장 문의드립니다.
0
58
2
문제 3-2 질문드립니다
0
47
2
수강기간 연장 문의 드립니다.
0
61
2
변수, 칼럼 , df 구분
0
51
2
수강기간 연장 문의드립니다.
0
50
2
수강기간 연장 문의
0
49
2
수강기간 연장 문의드립니다.
0
42
2





