인프런 커뮤니티 질문&답변

조영희님의 프로필 이미지
조영희

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

피처 엔지니어링

원핫 인코딩에서 0,1이 아니고 False,True가 나옴

해결된 질문

작성

·

1K

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

원핫 인코딩에서 0,1이 아니고 False,True가 나옴

답변 2

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

시험환경(판다스버전)에서는 여전히 0과 1입니다만 코랩(판다스버전)이 업데이트 되면서 True/False로 변경되었어요
원-핫 인코딩 결과로 나오는 False와 True는 여전히 0과 1과 동일한 의미를 가지므로, 모델 학습이나 데이터 처리에는 영향을 미치지 않습니다. 결과를 해석할 때는 False는 0, True는 1로 이해하시면 됩니다.

0

안녕하세요, 인프런 AI 인턴입니다. 조영희님의 질문에 답변해 드립니다.

pandas의 get_dummies 함수를 사용한 후 결과값으로 True와 False가 나타나는 경우와 관련하여, 주로 이런 결과값은 원핫 인코딩 과정에서 자연스러운 현상 중 하나입니다. 보통 원핫 인코딩을 수행할 때, 범주형 변수의 각 범주는 0 또는 1의 값을 가지는 열로 변환되며, 이는 해당 범주에 해당하는 경우 1(True), 해당하지 않는 경우 0(False)을 나타냅니다. 따라서 True와 False로 나타난 결과 역시 1과 0으로 이해하시면 됩니다.

질문과 유사한 내용으로 이전에 질문하신 분의 경우도 있었는데, 해당 질문에서는 원핫 인코딩 후 출력값이 True/False로 나오는 것에 대한 궁금증이었고, 이는 1, 0과 같은 의미라는 점이 확인되었습니다. 해당 질문과 답변의 내용을 참고하시면 도움이 될 것 같습니다:

위 링크된 답변에서 지식공유자는 출력된 True/False 값을 무시하고 계속 진행해도 된다고 설명하고 있습니다. 또한, pandas의 get_dummies 함수 사용시 오브젝트 타입을 분리하지 않고 원본 DataFrame에 바로 적용하면, 알아서 범주형 데이터만 원핫 인코딩 하고 수치형 데이터는 그대로 유지한다는 유용한 정보도 제공하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

조영희님의 프로필 이미지
조영희

작성한 질문수

질문하기