• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

5회 기출 질문

24.02.20 12:15 작성 24.02.20 12:16 수정 조회수 88

0

5회 기출 작업형 2에서

3회 기출 작업형 2에서 강사님께서 풀이하신 방식으로

train, test 데이터를 수치형, 범주형으로 나누고 수치형은 robustscaler, 범주형은 dummies를 활용한 후 concat으로 합치려고 했는데요!

아래처럼 코딩을 했는데 사진처럼 오류가 발생합니다ㅠㅠ

혹시 기출 3회 작업형 2는 회귀모형이 아니기 때문에,

기출 3회 작업형 2 풀이 방식을 기출 5회 작업형 2에 활용하지 못하는건가요?

 

import pandas as pd

train = pd.read_csv("train.csv")

test = pd.read_csv("test.csv")

 

n_train = train.select_dtypes(exclude ='object').copy

c_train = train.select_dtypes(include ='object').copy

n_test = test.select_dtypes(exclude = 'object').copy

c_test = test.select_dtypes(include = 'object').copy

 

 

from sklearn.preprocessing import RobustScaler

cols = ['year', 'mileage', 'tax', 'mpg', 'engineSize']

scaler = RobustScaler()

n_train[cols] = scaler.fit_transform(n_train[cols])

n_test[cols] = scaler.transform(n_test[cols])

 

 

c_train = pd.get_dummies(c_train)

c_test = pd.get_dummies(c_test)

 

 

train = pd.concat([n_train, c_train], axis=1)

test = pd.concat([n_test, c_test], axis=1)

 

print(train)

print(test)

Screenshot_20240220_120617_Samsung Internet.jpg

답변 1

답변을 작성해보세요.

1

아니요! 사용가능합니다.

아래 확인 부탁해요!

  • copy뒤에 ()괄호를 빼먹었음

  • cols 변수에 지정된 컬럼들이 실제 데이터에 존재하는지 체크