inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

빅데이터 분석기사 시험 실기(Python)

15강. 실전체험-모형학습

질문!

340

작성자 없음

작성한 질문수 0

0

더미화를 해주는데 라벨인코딩을 같이하는 이유가 무엇인가요?

python 빅데이터

답변 1

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.
라벨 인코딩은 범주형 변수를 숫자 형태로 변환하는 과정입니다. 하지만 라벨 인코딩으로 변환된 숫자는 기계학습 알고리즘이 이를 서로 비교가능한 연속값으로 해석할 수 있기 때문에, 원하지 않는 정보가 모델에 포함될 수 있습니다. 이를 방지하기 위해 더미화(원-핫 인코딩)를 진행합니다. 더미화는 각 범주를 서로 독립적인 특성으로 변환하여, 모든 범주가 동일한 중요도를 가지도록 만드는 방법입니다. 그래서 범주 사이의 상대적인 크기나 순서를 나타내지 않는 순수한 범주형 데이터로 변환하기 위해 라벨 인코딩 후 더미화를 같이 할 수 있습니다.

구름IDE 서비스 종료 이후 학습환경

0

122

1

10강 연습문제

0

166

1

VotingClassifier Hard 사용

0

111

1

구름IDE 실행 도움 요청

0

162

1

질문입니다 RandomForestClassifier

0

170

1

데이터 더미화 에러발생 질문.

0

319

1

많은 컬럼과 많은 결측치를 가지는 데이터

0

202

1

Dataset은 어디서 받을 수 있나요?

0

397

1

mpg 데이터셋 위치

0

340

1

교육영상 4강. 작업유형1-문제(1)에 대한 코드는 어디서 받을 수 있나요?

0

376

1

단순평균(1집단)T-test 1번 풀이

0

480

2

강의자료 문의

1

549

1

구름IDE 실행불가문제 ㅠㅠ

0

809

2

제7강 작업유형2-데이터 전처리: LabelEncoder 문법

0

443

1

5강 작업유형1-문제 2 질문입니다

0

407

1

7강 코드 질문드립니다

0

414

1

14강 실전 문제 카테고리 항목문의

0

397

1

작업2유형 문의

0

464

1

데이터셋 분리와 관련하여 질문이 있습니다.

0

447

1

5강의 작업형1-2문제 오류

0

461

1

구름 IDE

0

713

2

[공지] 데이터 전처리 관련 오류 수정

4

548

1

라벨인코더 관련 문의드립니다!

0

508

2

분류 예측에서 결과값의 구체적 내용을 확인할수 있는지요?

0

404

2