inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

데이터 전처리2 (인코딩, 스케일링)

스케일링

해결된 질문

37

semistone6239

작성한 질문수 9

0

혹시 스케일링에서는

 

인코딩과 다르게

 

for col in cols:

를 따로 하지않아도 되는 이유가 있나요?

 

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

스케일링은 한번에 여러셀 적용이 가능합니다 🙂 그렇게 만들어놨고

인코딩은 각각 사전을 만들고 그 사전을 보고 변경하는 것이라 한번에 한 컬럼씩만 작동이 됩니다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

아함님이 말씀하신 스케일링에서 for col in cols:를 따로 작성하지 않아도 되는 이유에 대해 설명 드리겠습니다.

스케일링 작업의 경우, 보통 scikit-learnScaler 모듈을 사용하여 여러 열에 동시에 적용할 수 있습니다. Scaler는 데이터를 2차원 배열 형태로 받아들이기 때문에, 특정 열들을 데이터 프레임 내의 데이터의 한 부분으로 처리하게 됩니다. 그렇기 때문에 여러 열을 한 번에 스케일링할 수 있어 반복문이 불필요합니다.

반면 LabelEncoder의 경우, 각 열을 개별적으로 다뤄야 하기 때문에 반복문을 사용하여 하나씩 처리하게 됩니다. LabelEncoder는 기본적으로 1D 배열 입력에 적합하게 설계되어 있기 때문에, 반복문을 통해 개별 컬럼을 변환해야 합니다.

이와 관련된 기존 질문과 답변을 확인하시길 추천드립니다:

  1. 스케일링이 적용된 방법에 대한 질문
  2. MinMaxScaler와 LabelEncoder의 차이

이러한 차이로 인해 for문을 사용하지 않아도 가능한 것이고, 전체적인 기능 및 차이가 핵심이라 할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

대응표본검정 레빈

0

13

2

단일표본검정 문제 유형

0

15

2

[작업형 3] 6~7. 카이제곱 검정

0

14

2

9회 작업형3 문제 1-1

0

19

2

최종답안 계산 방식 질문

0

14

1

시험 치기 전 급하게 질문 사항

0

24

2

유형3

0

23

2

작업형 2 연습문제 섹션 3

0

17

2

11 기출문제 ipynb파일

0

21

2

작업형 3 유형

0

21

2

11회 기출 유형(작업형1) 2번 정답

0

18

2

f1 score 질문

0

19

2

10회 작업형 2 인코딩 질의

0

15

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

21

2

28:19 roc_auc이유

0

20

2

수강연장문의

0

23

2

전체적인 머신러닝 순서

0

24

2

빅분기 실기 유형2질문

0

26

1

ID 전처리 이유

0

31

2

데이터제공

0

33

2

예시문제 작업형3 꼬리질문2번

0

22

1

데이터 개수를 구할 때, len과 value_counts 차이

0

28

2

작업형 2 제출방

0

22

2

인코딩 스케일링 순서

0

24

2