강의

멘토링

로드맵

Inflearn Community Q&A

hotdog3052684's profile image
hotdog3052684

asked

[After Work Side Projects] Big Data Analytics Engineer Practical Exam (Task Types 1, 2, 3)

Sample Task 2 (ver. 2023)

예시문제 작업형2(신버전) 레이블인코딩 관련 질문입니다.

Resolved

Written on

·

237

0

레이블 인코딩 시, train은 fit_transform 하고 test는 fit작업만 하는데 혹시 포문을 이용하지 않고

train['주구매상품'] = le.fit_transform(train['주구매상품'])

train['주구매지점'] = le.fit_transform(train['주구매지점'])

test['주구매상품'] = le.fit(test['주구매상품'])

test['주구매지점'] = le.fit(test['주구매지점'])

이런식으로 하드코딩 해줄때도 동일하게 test는 fit처리만 하면 되나요?

 

python머신러닝빅데이터pandas빅데이터분석기사

Answer 2

1

hotdog3052684님의 프로필 이미지
hotdog3052684
Questioner

train['주구매상품'] = le.fit_transform(train['주구매상품'])
test['주구매상품'] = le.transform(test['주구매상품'])
train['주구매지점'] = le.fit_transform(train['주구매지점'])
test['주구매지점'] = le.transform(test['주구매지점'])

이런식으로 순서를 변경하면 오류가 발생하지 않는데.. 순서가 관계가 있나요.
roadmap님의 프로필 이미지
roadmap
Instructor

네 지금 le를 덮어쓰고 있어서 순서가 상관있습니다 🙂

반복문을 사용하지 않는다면 말씀하신 방식을 사용해주세요

1

roadmap님의 프로필 이미지
roadmap
Instructor

네 반복문을 사용하지 않는 방식은 맞습니다 다만

test는 transform 만하는 것입니다.

fit은 잘못된 방식이에요!

hotdog3052684's profile image
hotdog3052684

asked

Ask a question