inflearn logo
강의

講義

知識共有

ビッグデータ分析記事試験実技(Python)

7強。ワークタイプ2-データ前処理

제7강 작업유형2-데이터 전처리: LabelEncoder 문법

443

sj

投稿した質問数 1

0

from sklearn.preprocessing import LabelEncoder
label=['species','island','sex'] 
enc=LabelEncoder() 
df[label]=df[label].apply(enc.fit_transform) 
#df[label]=enc.fit_transform(df[label])  

LabelEncoder 단계에서 apply 함수를 활용해서 fit_transform을 적용해야하는 이유는 무엇인가요?

아래 #처리된 구문처럼 적용하니 에러가 뜹니다

python 빅데이터

回答 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다.

LabelEncoder는 카테고리형 데이터를 숫자형 데이터로 변환해주는 역할을 합니다. apply 함수를 이용해서 LabelEncoder를 적용해야하는 이유는, apply 함수를 사용하면 함수를 열 또는 행에 적용시킬 수 있기 때문입니다.

df[label]은 species, island, sex 열을 선택한 것입니다. 이 열들은 카테고리형 데이터이므로 LabelEncoder를 적용해주어야 합니다. apply 함수를 사용하면, 선택된 열들 모두에 대해서 LabelEncoder를 적용할 수 있습니다. 만약 #처리된 구문을 적용하게 되면, df[label]의 전체 열에 대해서 fit_transform을 적용하게 됩니다. 이는 데이터 형식이 달라서 에러가 발생하는 것입니다.

즉, apply 함수를 사용하여 열 단위로 적용하는 것이 올바른 방법입니다.

더 자세한 내용은 아래 링크의 공식 문서를 참고하시기 바랍니다.

https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html

감사합니다.

구름IDE 서비스 종료 이후 학습환경

0

122

1

10강 연습문제

0

166

1

VotingClassifier Hard 사용

0

111

1

구름IDE 실행 도움 요청

0

162

1

질문입니다 RandomForestClassifier

0

170

1

질문!

0

340

1

데이터 더미화 에러발생 질문.

0

317

1

많은 컬럼과 많은 결측치를 가지는 데이터

0

201

1

Dataset은 어디서 받을 수 있나요?

0

395

1

mpg 데이터셋 위치

0

339

1

교육영상 4강. 작업유형1-문제(1)에 대한 코드는 어디서 받을 수 있나요?

0

376

1

단순평균(1집단)T-test 1번 풀이

0

480

2

강의자료 문의

1

549

1

구름IDE 실행불가문제 ㅠㅠ

0

808

2

5강 작업유형1-문제 2 질문입니다

0

407

1

7강 코드 질문드립니다

0

414

1

14강 실전 문제 카테고리 항목문의

0

397

1

작업2유형 문의

0

464

1

데이터셋 분리와 관련하여 질문이 있습니다.

0

446

1

5강의 작업형1-2문제 오류

0

460

1

구름 IDE

0

712

2

[공지] 데이터 전처리 관련 오류 수정

4

546

1

라벨인코더 관련 문의드립니다!

0

506

2

분류 예측에서 결과값의 구체적 내용을 확인할수 있는지요?

0

401

2