• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

선생님 타이타닉 인코딩 질문드립니다!

21.07.18 14:01 작성 조회수 96

0

타이타닉에서 인코딩할때 기존의 선생님이 transform을 하는방식이 아닌 apply를 이용해서 한번 시도 했는데 이건 왜 값이 출력이 안되나요?? ㅠ 만약 apply를 사용해서 출력할려면 어떻게 코딩해야할까요?

답변 1

답변을 작성해보세요.

1

안녕하십니까, 

음, 왜 apply 식을 이용해서 Label encoding fit_transform()을 수행하려 하시는 건지 잘 모르겠습니다만, 

LabelEncoder로 encoding을 시키려면 전체 데이터 세트가 필요합니다. 

그러니까, ['a', 'b', 'c',,,,,, ]와 같은 전체 데이터가 없으면 encoding을 몇개를 시켜야 할 지 알수 없습니다. 예를 들어 a,b,c 세종류만 있다면 0, 1, 2 와 같이 encoding 할 수 있습니다. 

하지만 apply 식은 개별 record즉 1건씩 데이터를 입력 받아서 처리를 하는 방식입니다. 때문에 전체 데이터가 아닌 1건만의 데이터를 encoding을 수행할 이유도 없고, 해서도 안됩니다. 그렇기 때문에 한건을 encoding 할 경우 오류를 발생 시킵니다. 

감사합니다.