인프런 커뮤니티 질문&답변

이재욱님의 프로필 이미지
이재욱

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

피처 엔지니어링

라벨 인코딩 반복문

해결된 질문

작성

·

103

0

수치형 민맥스 스케일링 할때는 반복문을 사용하지 않고 한번에 함수에 넣고 fit_transform하였는데 왜 라벨 인코딩 (문자열)은 한번에 처리 안되고 반복문을 통해서 하나씩 함수에 넣어야 하나요?

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네, 맞습니다. 그렇게 처리해야 합니다 😃
왜 한 번에 안될까 싶으시죠?


1. 숫자는 한번에 처리가 가능합니다. 스케일링 함수도 그렇게 만들어졌고요~
2. 문자는 각 컬럼별로 사전을 먼저 만들고 맵핑해야 하는 작업들이 함수내에서 처리 되므로
라벨 인코더는 각 컬럼별 처리가 필요해요 (예를 들어, "red", "green", "blue"와 같은 문자열 값들을 0, 1, 2와 같은 정수로 변환)

이재욱님의 프로필 이미지
이재욱

작성한 질문수

질문하기