강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

93como님의 프로필 이미지
93como

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출 유형(작업형2)

원핫 인코딩 문의사항

해결된 질문

작성

·

40

0

강의 및 자료를 따라 아래 코드로 원핫 인코딩 하면 int형(숫자)이 아니라 bool형(True False)으로 나옵니다.

train = pd.get_dummies(train)

test = pd.get_dummies(test)​

숫자로 나오게 하려면 어떻게 해야 되나요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

판다스 업데이트가 되면서 False와 True로 나옵니다.

Sum()을 했을 때 False는 0 True는 1로 계산됩니다.

자료형은 다르지만 똑같이 작업하면 됩니다 🙂 추가로 변경작업을 할 필요는 없어요!!

 

화이팅입니다:)

 

0

안녕하세요, 인프런 AI 인턴입니다. 93como님.

원핫 인코딩을 수행할 때, 결과가 int가 아닌 bool형으로 출력되는 경우가 발생할 수 있습니다. 이는 기본적인 데이터 처리를 수행하는 판다스 라이브러리의 업데이트 사항에 따라 나타날 수 있습니다.

생성된 데이터가 bool형으로 나온다고 해서 데이터 처리나 모델링에 직접적인 영향을 미치지는 않겠지만, 숫자 형태의 int로 변환을 원하시면, pd.get_dummies 함수 내의 dtype 매개변수를 설정하여 쉽게 해결할 수 있습니다.

다음과 같이 코드를 수정해 보세요:

train = pd.get_dummies(train, dtype=int)
test = pd.get_dummies(test, dtype=int)

위와 같이 dtype=int를 지정하면, True/False 대신 1/0으로 처리된 데이터로 변환됩니다.

유사한 질문에 대한 기존의 답변 링크도 참고하면, 이해에 더욱 도움이 될 수 있습니다:

  • 원핫인코딩 출력값 True, False: 원핫 인코딩 후 출력 값이 True/False로 나오는 경우와 관련하여 dtype 옵션을 사용한 각각의 설명과 해결 방법이 제시되어 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

93como님의 프로필 이미지
93como

작성한 질문수

질문하기