• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

원-핫 인코딩에 대해 질문합니다.

22.05.05 10:06 작성 조회수 118

0

원핫인코딩 파트에서 OneHotEncoder와 pd.get_dummies 방법을 알려주셨습니다. 보았을 때 두 방법이 전자는 최종적으로 ndarray 형태를 반환하고, 후자는 DataFrame 형태를 반환한다는 것 외에는 큰 차이가 없어보입니다. 혹시 두 방법 모두 추후에 머신러닝 알고리즘에 적용하였을 때 문제가 없는 것일까요 ? 그리고 두 방법의 차이점이 있는지 여쭤보고 싶습니다. 감사합니다.

답변 1

답변을 작성해보세요.

1

안녕하십니까, 

두 방법 모두 머신러닝 모델에 적용했을 때 문제 없습니다. 사이킷런은 DataFrame과도 문제 없이 호환됩니다. 

다만 get_dummies()가 좀 더 편리하게 원-핫 인코딩으로 변환할 수 있습니다.