inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(분류)

ndarray로 바뀐 사유가 궁금합니다..

해결된 질문

73

김치현

작성한 질문수 31

0

이런 문장이 뜨던데 accuracy_score(ans, pred) 중 pred가 numpy.ndarray 배열이 된 것 같거든요..

잘 따라한 것 같은데 선생님이 한건 바로 accuracy_score를 바로 볼 수 있고, 제거는 못보여 지네요..

pd.DataFrame(pred) 사용해서 해결하긴 했는데,, numpy배열로 바뀐 사유가 궁금합니다.

 

 

y_train['income'] = y_train['income'].str.replace(">50K", '1')
y_train['income'] = y_train['income'].str.replace("<=50K", '0')

y_train['income'].astype(int)
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier()
rf.fit(X_train[list], target)
pred = rf.predict(X_test[list])

submit = pd.DataFrame(
    {
        'id' : X_test['id'],
        'income' : pred
    }
)

submit.to_csv("1111.csv", index = False)

y_test.head()
(y_test['income']=='>50K').astype(int)
from sklearn.metrics import accuracy_score
y_test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p2/data_atype_y/y_test.csv")
ans = (y_test['income'] == '>50K').astype(int)
pred = pred.astype(int)
accuracy_score(ans, pred)

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

원래 pred는 ndarray가 맞습니다.

이를 데이터프레임으로 변환하는 코드를 통해서 데이터프레임으로 보이는 것이에요

submit = pd.DataFrame( { 'id' : X_test['id'], 'income' : pred } )

작업형 1 유형 부분

0

9

1

작업형 1 (삭제예정, 구 버전)

0

28

2

수강기간 연장 문의드립니다.

0

21

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

23

3

수강기간 연장 문의드립니다.

0

26

1

인덱스 슬라이싱

0

27

2

질문 드립니다.

0

45

2

강의 내용 관련 질문드립니다~

0

43

2

수강 연장 문의

0

54

2

강의자료 일괄 다운로드

0

50

2

수강기간 연장 문의드립니다

0

40

2

list 문제 질문드립니다~

0

35

2

빅분기 실기 12회 재도전

0

53

2

강의 기간 연장 가능여부 검토 요청건

0

39

2

수강기간 연장 문의 드립니다

0

43

2

수강기간 연장 문의드립니다

0

50

2

질문이요

0

56

2

수강기간 연장 문의드립니다.

0

58

2

문제 3-2 질문드립니다

0

47

2

수강기간 연장 문의 드립니다.

0

61

2

변수, 칼럼 , df 구분

0

51

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

49

2

수강기간 연장 문의드립니다.

0

42

2