인프런 커뮤니티 질문&답변

박태준님의 프로필 이미지
박태준

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

5회 기출 질문

해결된 질문

작성

·

195

·

수정됨

0

5회 기출 작업형 2에서

3회 기출 작업형 2에서 강사님께서 풀이하신 방식으로

train, test 데이터를 수치형, 범주형으로 나누고 수치형은 robustscaler, 범주형은 dummies를 활용한 후 concat으로 합치려고 했는데요!

아래처럼 코딩을 했는데 사진처럼 오류가 발생합니다ㅠㅠ

혹시 기출 3회 작업형 2는 회귀모형이 아니기 때문에,

기출 3회 작업형 2 풀이 방식을 기출 5회 작업형 2에 활용하지 못하는건가요?

 

import pandas as pd

train = pd.read_csv("train.csv")

test = pd.read_csv("test.csv")

 

n_train = train.select_dtypes(exclude ='object').copy

c_train = train.select_dtypes(include ='object').copy

n_test = test.select_dtypes(exclude = 'object').copy

c_test = test.select_dtypes(include = 'object').copy

 

 

from sklearn.preprocessing import RobustScaler

cols = ['year', 'mileage', 'tax', 'mpg', 'engineSize']

scaler = RobustScaler()

n_train[cols] = scaler.fit_transform(n_train[cols])

n_test[cols] = scaler.transform(n_test[cols])

 

 

c_train = pd.get_dummies(c_train)

c_test = pd.get_dummies(c_test)

 

 

train = pd.concat([n_train, c_train], axis=1)

test = pd.concat([n_test, c_test], axis=1)

 

print(train)

print(test)

Screenshot_20240220_120617_Samsung Internet.jpg

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

아니요! 사용가능합니다.

아래 확인 부탁해요!

  • copy뒤에 ()괄호를 빼먹었음

  • cols 변수에 지정된 컬럼들이 실제 데이터에 존재하는지 체크

박태준님의 프로필 이미지
박태준

작성한 질문수

질문하기