강의

멘토링

커뮤니티

Inflearn Community Q&A

joy107806925's profile image
joy107806925

asked

[Side Project After Work] Big Data Analysis Certification Practical Exam (Type 1, 2, 3)

Type 4 Past Exam Questions (Task Type 2)

인코딩

Resolved

Written on

·

223

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

범주형 데이터가 있으면 필수로 인코딩을 해줘야하는걸로 알고 있는데요

이때 무조건 라벨인코딩으로 진행하려고 하는데 문제없는 사항인가요?

python머신러닝빅데이터pandas빅데이터분석기사

Answer 2

1

LabelEncoder을 사용하면 왠만한 문제는 해결됩니다만 무조건은 아닙니다.

 

다양한 인코더를 참고해보세요

원핫 인코더, 이진 인코더 등

0

roadmap님의 프로필 이미지
roadmap
Instructor

데이터가 어떤 형태인지 알 수 없어 무조건이란 말은 위험합니다.

왠만하면 라벨 인코딩시 처리 될 것으로 보입니다.

joy10780님의 프로필 이미지
joy10780
Questioner

아하! 넵넵

그렇다면 언제 라벨인코딩을 하며 언제 원핫인코딩을 하는 것일까요?

무엇을 보고 판단하여야할지요...

roadmap님의 프로필 이미지
roadmap
Instructor

가장 좋은 것은 둘다 해보고

검증데이터로 평가해보고 성능이 좋은 것을 선택하면됩니다.

또는 범주형 컬럼이 많고, 또한 카테고리가 너무 많으면(10개이상?) 라벨인코딩하는 것을 추천해요~~

joy107806925's profile image
joy107806925

asked

Ask a question