[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

피처 엔지니어링 코드 이래도 될까욧!?

해결된 질문2023-06-15T13:13:07.973Z

256

sychang2000

작성한 질문수 15

# 피처 엔지니어링
cols1 = list(X_train.columns[X_train.dtypes == object]) # 범주형
cols2 = list(X_train.columns[X_train.dtypes != object]) # 수치형

Xc_train = X_train[cols1] # 범주형
Xc_test = X_test[cols1]
Xn_train = X_train[cols2] # 수치형
Xn_test = X_test[cols2]


Xc_train = pd.get_dummies(X_train[cols1])
Xc_test = pd.get_dummies(X_test[cols1])

from sklearn.preprocessing import RobustScaler

Ro = RobustScaler()
X_train[cols2] = Ro.fit_transform(X_train[cols2])
X_test[cols2] = Ro.transform(X_test[cols2])

Xn_train = X_train[cols2] # 수치형
Xn_test = X_test[cols2]

X_train = pd.concat([Xc_train, Xn_train], axis = 1)
X_test = pd.concat([Xc_test, Xn_test], axis = 1)
print(X_train)
print(X_test)

늘 빠른 답변 감사드려용

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

퇴근후딴짓

2023-06-15T13:22:04.154Z

네 그런데 혹시 모르니 cols2는 체크를 할 필요가 있어요 int, float외 다른 자료형이 있을 수도 있습니다.

인코딩의 경우 train과 test종류가 다르다면 합쳐서 인코딩 하고 다시 분할하는 것도 연습해주세요:)

sychang2000

2023-06-16T06:32:31.085Z

train과 test의 종류가 다르다면 합쳐서 인코딩하라고 하셨는데 종류가 다르다는게 무슨 뜻인가용? train과 test의 열이 다르다는 건가요?

퇴근후딴짓

2023-06-16T08:55:44.851Z

train에는 사과 딸기 포도가 있는데

test에는 딸기 수박이 있다면 어떻게 될까요?

fit을 통해 사과는 0, 딸기는 1, 포도는 2라고 사전을 만들고
transform을 통해서 train은 무사히 변환 되지만
test는 에러발생!!!! 수박을 알 수 없음!! 이라고 나옵니다.

이에 합쳐서 인코딩(사과는 0, 딸기는 1, 포도는 2, 수박은 3)을 진행하는 것을 말했어요

(추가적으로 합쳐서 진행할 경우 데이터 누수라는 부정적 영향이 있는데 이것은 빅분기에서는 다루진 않을 것 같아 생략하겠습니다)

sychang2000

2023-06-17T07:19:39.525Z

감사합니다!!!! 이해가 팍팍 잘되네용!!!!

출력값 질문

2026-06-24T12:26:55.287Z

수업노트가 어디에 있나요?

2026-06-23T07:11:33.421Z

실기시험 제출관련

2026-06-20T06:28:58.644Z

154

6.20 작업형 2 과적합

2026-06-20T04:23:55.395Z

158

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

2026-06-19T21:10:17.635Z

로지스틱회귀, 회귀

2026-06-19T11:01:31.262Z

회귀 문제를 풀때 질문입니다.

2026-06-19T06:56:29.961Z

불균형 처리 후 성능이 더 낮아졌다면,

2026-06-19T06:12:48.627Z

실기 체험 제2유형 에러 문의

2026-06-19T05:08:00.718Z

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

2026-06-19T05:05:41.876Z

3번문제 등분산 가정

2026-06-19T01:35:38.160Z

작업형3 target 형 변환 질문

2026-06-19T01:33:51.482Z

[작업형1] 연습문제 섹션1 ~ 10 의 section4

2026-06-19T01:21:52.627Z

원핫인코딩과 레이블 인코딩에서 concat

2026-06-18T15:28:30.350Z

제2유형 질문입니다.

2026-06-18T10:36:02.567Z

C()

2026-06-18T09:54:32.325Z

작업형 2에서 strafity 적용 유무

2026-06-18T09:36:12.726Z

수강 기간 연장 가능 여부 문의드립니다.

2026-06-18T08:51:55.170Z

ols

2026-06-18T08:45:28.564Z

2유형 작성관련 질문(일반 심화)

2026-06-18T06:52:24.383Z

2유형 작성관련 질문

2026-06-18T06:22:01.218Z

2유형 object컬럼 개수 다르면

2026-06-18T05:49:00.431Z

코딩팡질문이요ㅠㅠ

2026-06-18T03:15:44.394Z

관찰값과 기대값의 개념이 헷갈립니다.

2026-06-18T02:18:44.127Z