🤍 전 강의 25% 할인 중 🤍

2024년 상반기를 돌아보고 하반기에도 함께 성장해요!
인프런이 준비한 25% 할인 받으러 가기 >>

  • 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

인코딩 전후 데이터 크기 관련

23.06.19 00:18 작성 23.06.19 00:19 수정 조회수 232

0

작업형2 예시문제는

X_train과 X_test의 '주구매상품' 컬럼의 카테고리 개수와 종류가 다른 경우였습니다(차집합 소형가전)

인코딩 전에 두 데이터를 concat -> 인코딩 후 -> 다시 두 개로 분리하는 것은 원핫 인코딩에만 해당되는 것일까요?

왜냐면 라벨 인코딩은 제가 concat 과정을 생략하고 모델 선택 및 예측까지 진행했을 때 딱히 에러가 발생하거나 성능에 문제가 있어보이진 않았습니다. 선생님도 강의에서 라벨 인코딩을 진행하면서 concat 과정을 거치지 않은 걸로 보이고요

object형의 카테고리 개수가 다르더라도 라벨 인코딩을 선택한다면 별도의 처리를 거치지 않아도 되는 것인지가 궁금합니다

늘 감사드립니다

답변 1

답변을 작성해보세요.

0

train엔 있고 test에는 없으면 괜찮습니다. 문제 없음

train엔 없고 test에는 있으면 문제가 됩니다. (합쳐서 진행하는 별도 처리 필요함)

화이팅입니다. 💪

 

 

채널톡 아이콘