inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

Bài tập ví dụ Loại thực hành 2 (phiên bản 2023)

오류

Đã giải quyết

318

joy10780

28 câu hỏi đã được viết

0

import pandas as pd

train = pd.read_csv("data/customer_train.csv")

test = pd.read_csv("data/customer_test.csv")

pd.set_option('display.max_columns',None)

 

train['환불금액'] = train['환불금액'].fillna(0)

test['환불금액'] = test['환불금액'].fillna(0)

 

cols = train.select_dtypes(exclude='object').columns

target = train.pop('성별')

 

from sklearn.ensemble import RandomForestClassifier

rf = RandomForestClassifier()

rf.fit(train[cols], target)

pred = rf.predict_proba(test[cols])

print(pred)

 

오류

Makefile:6: recipe for target 'py3_run' failed

make: *** [py3_run] Error 1

Traceback (most recent call last):

File "/goorm/Main.out", line 29, in <module>

model.fit(train[cols], target)

File "/usr/local/lib/python3.9/dist-packages/pandas/core/frame.py", line 3511, in getitem

indexer = self.columns._get_indexer_strict(key, "columns")[1]

File "/usr/local/lib/python3.9/dist-packages/pandas/core/indexes/base.py", line 5782, in getindexer_strict

self._raise_if_missing(keyarr, indexer, axis_name)

File "/usr/local/lib/python3.9/dist-packages/pandas/core/indexes/base.py", line 5845, in raiseif_missing

raise KeyError(f"{not_found} not in index")

KeyError: "['성별'] not in index"

도와주세요 왜 select_dtypes로 쓰니까 안되나요

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 2

0

roadmap

순서 문제 맞아요

test[cols]에서 '성별' 컬럼이 없는데 cols에 사용해서 에러가 발생합니다

0

joy10780

test[cols]에서 '성별' 컬럼이 없는건 이해했는데

cols에 성별을 사용했다는게 무슨 말인지 모르겠씁니다 ㅜㅜㅜ

cols= 부분이랑

pop부분

순서만 바꿔주면 되던데

왜 꼭 그래야만 하는지 이유를 모르겠어요.......

0

joy10780

음....

cols 정의 부분하고

pop부분 순서바꾸니까 되는데

이거슨 순서가 상관없을 줄 알았는데...

명확한 이유를 모르겠씁니다.

0

roadmap

target = train.pop('성별')은 전처리에서 가장 위에 해주세요

target이 수치형일 때 cols에 포함이 되어 버립니다. print(cols)로 정확하게 확인해 주세요~

성별은 이제 train과 test에 없는데 포함이 되니

에러가 발생합니다.

 

"기출(작업형2) 한 가지 방법으로 풀기" 영상 새로 추가한 것 봐주시겠어요?

ols

0

1

0

2유형 작성관련 질문(일반 심화)

0

11

1

2유형 작성관련 질문

0

8

1

2유형 object컬럼 개수 다르면

0

10

1

코딩팡질문이요ㅠㅠ

0

12

1

관찰값과 기대값의 개념이 헷갈립니다.

0

11

1

작업형2 ID 컬럼 삭제 질문

0

20

2

2유형 작성관련 질문

0

10

1

memoryerror 질문

0

12

1

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

13

0

ID 삭제 필수 인가요?

0

17

3

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

13

1

3 유형 귀무가설, 대립가설

0

19

2

인코딩 관련 질문 있습니다

0

21

2

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

21

2

2유형 원핫인코딩 오류

0

22

2

시험장에서 주석 단축키 안될 때 많나요?

0

26

2

라벨인코딩 방식

0

24

2

test 재학습 관련

0

15

2

target 빈도 확인

0

17

2

작업형 2 연습문제 섹션 6

0

20

2

F1-score

0

19

2

작업형 2번 섹션 3

0

18

2

작업형 2 인코딩, 결측치, 모델 선택 질문

0

22

1