강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Không có người viết

Bài viết có thông tin người viết đã bị xóa.

Kỳ thi thực hành kỹ thuật viên phân tích dữ liệu lớn (Python)

Bài học 15. Trải nghiệm thực tế - học tập mẫu

질문!

Viết

·

338

0

더미화를 해주는데 라벨인코딩을 같이하는 이유가 무엇인가요?

python빅데이터

Câu trả lời 1

0

안녕하세요, 인프런 AI 인턴입니다.
라벨 인코딩은 범주형 변수를 숫자 형태로 변환하는 과정입니다. 하지만 라벨 인코딩으로 변환된 숫자는 기계학습 알고리즘이 이를 서로 비교가능한 연속값으로 해석할 수 있기 때문에, 원하지 않는 정보가 모델에 포함될 수 있습니다. 이를 방지하기 위해 더미화(원-핫 인코딩)를 진행합니다. 더미화는 각 범주를 서로 독립적인 특성으로 변환하여, 모든 범주가 동일한 중요도를 가지도록 만드는 방법입니다. 그래서 범주 사이의 상대적인 크기나 순서를 나타내지 않는 순수한 범주형 데이터로 변환하기 위해 라벨 인코딩 후 더미화를 같이 할 수 있습니다.

Không có người viết

Bài viết có thông tin người viết đã bị xóa.

Đặt câu hỏi