작성
·
192
0
원핫인코딩 파트에서 OneHotEncoder와 pd.get_dummies 방법을 알려주셨습니다. 보았을 때 두 방법이 전자는 최종적으로 ndarray 형태를 반환하고, 후자는 DataFrame 형태를 반환한다는 것 외에는 큰 차이가 없어보입니다. 혹시 두 방법 모두 추후에 머신러닝 알고리즘에 적용하였을 때 문제가 없는 것일까요 ? 그리고 두 방법의 차이점이 있는지 여쭤보고 싶습니다. 감사합니다.
답변 1
1
안녕하십니까,
두 방법 모두 머신러닝 모델에 적용했을 때 문제 없습니다. 사이킷런은 DataFrame과도 문제 없이 호환됩니다.
다만 get_dummies()가 좀 더 편리하게 원-핫 인코딩으로 변환할 수 있습니다.