ndarray로 바뀐 사유가 궁금합니다..
Labels in y_true and y_pred should be of the same type. Got y_true=[0 1] and y_pred=['0' '1']. Make sure that the predictions provided by the classifier coincides with the true labels.
이런 문장이 뜨던데 accuracy_score(ans, pred) 중 pred가 numpy.ndarray 배열이 된 것 같거든요..
잘 따라한 것 같은데 선생님이 한건 바로 accuracy_score를 바로 볼 수 있고, 제거는 못보여 지네요..
pd.DataFrame(pred) 사용해서 해결하긴 했는데,, numpy배열로 바뀐 사유가 궁금합니다.
y_train['income'] = y_train['income'].str.replace(">50K", '1')
y_train['income'] = y_train['income'].str.replace("<=50K", '0')
y_train['income'].astype(int)from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier()
rf.fit(X_train[list], target)
pred = rf.predict(X_test[list])
submit = pd.DataFrame(
{
'id' : X_test['id'],
'income' : pred
}
)
submit.to_csv("1111.csv", index = False)
y_test.head()
(y_test['income']=='>50K').astype(int)from sklearn.metrics import accuracy_score
y_test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p2/data_atype_y/y_test.csv")
ans = (y_test['income'] == '>50K').astype(int)
pred = pred.astype(int)
accuracy_score(ans, pred)
답변 1
0
원래 pred는 ndarray가 맞습니다.
이를 데이터프레임으로 변환하는 코드를 통해서 데이터프레임으로 보이는 것이에요
submit = pd.DataFrame( { 'id' : X_test['id'], 'income' : pred } )
작업형2 카테고리
0
5
1
110강 회귀_8번 문의
0
8
2
XGBRegressor 학습 시 warning 출력
0
11
2
데이터 프레임을 변경해도 되나요?
0
9
2
10회 기출 작업형3 문제 2-1 질문
0
14
2
작업형 2 질문
0
13
2
작업형 2 템플릿 확인 요청
0
12
2
작업형2 인코딩 질문
0
22
2
작업형 3 벼락치기 공부방법 질문
0
30
2
기출 11회 작업형 2_전체 데이터 학습 여부
0
31
2
예측값 결과 소수점 차이
0
27
2
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
34
1
전처리 train() test([ ])
0
23
2
작업형 1 배경지식 질문
0
32
2
옳게 풀은건지 질문드립니다!
0
21
1
roc_auc_score
0
29
2
추가질문 합니다
0
22
2
시험환경 구름
0
20
2
2유형 질문드려요
0
21
2
RandomForest vs lgb
0
27
2
전처리 관련질문
0
29
3
작업형3 기출
0
19
2
유형2에서 데이터분할 생략 가능여부
0
32
2
9회 기출 유형3 질문
0
21
2





