inflearn logo
강의

Course

Instructor

[Side Project After Work] Big Data Analysis Certification Practical Exam (Type 1, 2, 3)

Example Problem Task Type 2 (ver. 2023)

오류

Resolved

318

joy10780

28 asked

0

import pandas as pd

train = pd.read_csv("data/customer_train.csv")

test = pd.read_csv("data/customer_test.csv")

pd.set_option('display.max_columns',None)

 

train['환불금액'] = train['환불금액'].fillna(0)

test['환불금액'] = test['환불금액'].fillna(0)

 

cols = train.select_dtypes(exclude='object').columns

target = train.pop('성별')

 

from sklearn.ensemble import RandomForestClassifier

rf = RandomForestClassifier()

rf.fit(train[cols], target)

pred = rf.predict_proba(test[cols])

print(pred)

 

오류

Makefile:6: recipe for target 'py3_run' failed

make: *** [py3_run] Error 1

Traceback (most recent call last):

File "/goorm/Main.out", line 29, in <module>

model.fit(train[cols], target)

File "/usr/local/lib/python3.9/dist-packages/pandas/core/frame.py", line 3511, in getitem

indexer = self.columns._get_indexer_strict(key, "columns")[1]

File "/usr/local/lib/python3.9/dist-packages/pandas/core/indexes/base.py", line 5782, in getindexer_strict

self._raise_if_missing(keyarr, indexer, axis_name)

File "/usr/local/lib/python3.9/dist-packages/pandas/core/indexes/base.py", line 5845, in raiseif_missing

raise KeyError(f"{not_found} not in index")

KeyError: "['성별'] not in index"

도와주세요 왜 select_dtypes로 쓰니까 안되나요

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Answer 2

0

roadmap

순서 문제 맞아요

test[cols]에서 '성별' 컬럼이 없는데 cols에 사용해서 에러가 발생합니다

0

joy10780

test[cols]에서 '성별' 컬럼이 없는건 이해했는데

cols에 성별을 사용했다는게 무슨 말인지 모르겠씁니다 ㅜㅜㅜ

cols= 부분이랑

pop부분

순서만 바꿔주면 되던데

왜 꼭 그래야만 하는지 이유를 모르겠어요.......

0

joy10780

음....

cols 정의 부분하고

pop부분 순서바꾸니까 되는데

이거슨 순서가 상관없을 줄 알았는데...

명확한 이유를 모르겠씁니다.

0

roadmap

target = train.pop('성별')은 전처리에서 가장 위에 해주세요

target이 수치형일 때 cols에 포함이 되어 버립니다. print(cols)로 정확하게 확인해 주세요~

성별은 이제 train과 test에 없는데 포함이 되니

에러가 발생합니다.

 

"기출(작업형2) 한 가지 방법으로 풀기" 영상 새로 추가한 것 봐주시겠어요?

기출 11회 작업형 2_전체 데이터 학습 여부

0

10

1

예측값 결과 소수점 차이

0

15

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

13

0

전처리 train() test([ ])

0

13

2

작업형 1 배경지식 질문

0

16

2

옳게 풀은건지 질문드립니다!

0

12

1

roc_auc_score

0

22

2

추가질문 합니다

0

13

2

시험환경 구름

0

16

2

2유형 질문드려요

0

13

2

RandomForest vs lgb

0

22

2

전처리 관련질문

0

21

3

작업형3 기출

0

15

2

유형2에서 데이터분할 생략 가능여부

0

27

2

9회 기출 유형3 질문

0

16

2

lgb 기초편

0

12

1

괄호 사용

0

20

2

작업형 2 데이터 전처리 질문

0

20

1

11회 기출 유형 작업형1 문제 3-1

0

17

1

예시문제 작업형2 (ver2023) 질문입니다

0

19

2

Data type에 따른 처리

0

19

2

데이터 전처리 관련

0

17

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

25

2