-
카테고리
-
세부 분야
자격증 (데이터 사이언스)
-
해결 여부
해결됨
5회 기출 질문
24.02.20 12:15 작성 24.02.20 12:16 수정 조회수 88
0
5회 기출 작업형 2에서
3회 기출 작업형 2에서 강사님께서 풀이하신 방식으로
train, test 데이터를 수치형, 범주형으로 나누고 수치형은 robustscaler, 범주형은 dummies를 활용한 후 concat으로 합치려고 했는데요!
아래처럼 코딩을 했는데 사진처럼 오류가 발생합니다ㅠㅠ
혹시 기출 3회 작업형 2는 회귀모형이 아니기 때문에,
기출 3회 작업형 2 풀이 방식을 기출 5회 작업형 2에 활용하지 못하는건가요?
import pandas as pd
train = pd.read_csv("train.csv")
test = pd.read_csv("test.csv")
n_train = train.select_dtypes(exclude ='object').copy
c_train = train.select_dtypes(include ='object').copy
n_test = test.select_dtypes(exclude = 'object').copy
c_test = test.select_dtypes(include = 'object').copy
from sklearn.preprocessing import RobustScaler
cols = ['year', 'mileage', 'tax', 'mpg', 'engineSize']
scaler = RobustScaler()
n_train[cols] = scaler.fit_transform(n_train[cols])
n_test[cols] = scaler.transform(n_test[cols])
c_train = pd.get_dummies(c_train)
c_test = pd.get_dummies(c_test)
train = pd.concat([n_train, c_train], axis=1)
test = pd.concat([n_test, c_test], axis=1)
print(train)
print(test)
답변을 작성해보세요.
1
퇴근후딴짓
지식공유자2024.02.21
아니요! 사용가능합니다.
아래 확인 부탁해요!
copy뒤에 ()괄호를 빼먹었음
cols 변수에 지정된 컬럼들이 실제 데이터에 존재하는지 체크
답변 1