스케일링

Question

혹시 스케일링에서는 인코딩과 다르게 for col in cols: 를 따로 하지않아도 되는 이유가 있나요?

퇴근후딴짓 · Answer

스케일링은 한번에 여러셀 적용이 가능합니다 🙂 그렇게 만들어놨고 인코딩은 각각 사전을 만들고 그 사전을 보고 변경하는 것이라 한번에 한 컬럼씩만 작동이 됩니다.

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. 아함님이 말씀하신 스케일링에서 for col in cols: 를 따로 작성하지 않아도 되는 이유에 대해 설명 드리겠습니다. 스케일링 작업의 경우, 보통 scikit-learn 의 Scaler 모듈을 사용하여 여러 열에 동시에 적용할 수 있습니다. Scaler 는 데이터를 2차원 배열 형태로 받아들이기 때문에, 특정 열들을 데이터 프레임 내의 데이터의 한 부분으로 처리하게 됩니다. 그렇기 때문에 여러 열을 한 번에 스케일링할 수 있어 반복문이 불필요합니다. 반면 LabelEncoder 의 경우, 각 열을 개별적으로 다뤄야 하기 때문에 반복문을 사용하여 하나씩 처리하게 됩니다. LabelEncoder 는 기본적으로 1D 배열 입력에 적합하게 설계되어 있기 때문에, 반복문을 통해 개별 컬럼을 변환해야 합니다. 이와 관련된 기존 질문과 답변을 확인하시길 추천드립니다: 스케일링이 적용된 방법에 대한 질문 MinMaxScaler와 LabelEncoder의 차이 이러한 차이로 인해 for문을 사용하지 않아도 가능한 것이고, 전체적인 기능 및 차이가 핵심이라 할 수 있습니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.