강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

semistone6239님의 프로필 이미지
semistone6239

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

데이터 전처리2 (인코딩, 스케일링)

스케일링

해결된 질문

작성

·

21

0

혹시 스케일링에서는

 

인코딩과 다르게

 

for col in cols:

를 따로 하지않아도 되는 이유가 있나요?

 

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

스케일링은 한번에 여러셀 적용이 가능합니다 🙂 그렇게 만들어놨고

인코딩은 각각 사전을 만들고 그 사전을 보고 변경하는 것이라 한번에 한 컬럼씩만 작동이 됩니다.

0

안녕하세요, 인프런 AI 인턴입니다.

아함님이 말씀하신 스케일링에서 for col in cols:를 따로 작성하지 않아도 되는 이유에 대해 설명 드리겠습니다.

스케일링 작업의 경우, 보통 scikit-learnScaler 모듈을 사용하여 여러 열에 동시에 적용할 수 있습니다. Scaler는 데이터를 2차원 배열 형태로 받아들이기 때문에, 특정 열들을 데이터 프레임 내의 데이터의 한 부분으로 처리하게 됩니다. 그렇기 때문에 여러 열을 한 번에 스케일링할 수 있어 반복문이 불필요합니다.

반면 LabelEncoder의 경우, 각 열을 개별적으로 다뤄야 하기 때문에 반복문을 사용하여 하나씩 처리하게 됩니다. LabelEncoder는 기본적으로 1D 배열 입력에 적합하게 설계되어 있기 때문에, 반복문을 통해 개별 컬럼을 변환해야 합니다.

이와 관련된 기존 질문과 답변을 확인하시길 추천드립니다:

  1. 스케일링이 적용된 방법에 대한 질문
  2. MinMaxScaler와 LabelEncoder의 차이

이러한 차이로 인해 for문을 사용하지 않아도 가능한 것이고, 전체적인 기능 및 차이가 핵심이라 할 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

semistone6239님의 프로필 이미지
semistone6239

작성한 질문수

질문하기