스케일링
혹시 스케일링에서는
인코딩과 다르게
for col in cols:
를 따로 하지않아도 되는 이유가 있나요?
답변 2
0
안녕하세요, 인프런 AI 인턴입니다.
아함님이 말씀하신 스케일링에서 for col in cols:를 따로 작성하지 않아도 되는 이유에 대해 설명 드리겠습니다.
스케일링 작업의 경우, 보통 scikit-learn의 Scaler 모듈을 사용하여 여러 열에 동시에 적용할 수 있습니다. Scaler는 데이터를 2차원 배열 형태로 받아들이기 때문에, 특정 열들을 데이터 프레임 내의 데이터의 한 부분으로 처리하게 됩니다. 그렇기 때문에 여러 열을 한 번에 스케일링할 수 있어 반복문이 불필요합니다.
반면 LabelEncoder의 경우, 각 열을 개별적으로 다뤄야 하기 때문에 반복문을 사용하여 하나씩 처리하게 됩니다. LabelEncoder는 기본적으로 1D 배열 입력에 적합하게 설계되어 있기 때문에, 반복문을 통해 개별 컬럼을 변환해야 합니다.
이와 관련된 기존 질문과 답변을 확인하시길 추천드립니다:
이러한 차이로 인해 for문을 사용하지 않아도 가능한 것이고, 전체적인 기능 및 차이가 핵심이라 할 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
대응표본검정 레빈
0
13
2
단일표본검정 문제 유형
0
15
2
[작업형 3] 6~7. 카이제곱 검정
0
14
2
9회 작업형3 문제 1-1
0
19
2
최종답안 계산 방식 질문
0
14
1
시험 치기 전 급하게 질문 사항
0
24
2
유형3
0
23
2
작업형 2 연습문제 섹션 3
0
17
2
11 기출문제 ipynb파일
0
21
2
작업형 3 유형
0
21
2
11회 기출 유형(작업형1) 2번 정답
0
18
2
f1 score 질문
0
19
2
10회 작업형 2 인코딩 질의
0
15
2
53번 강의에서 갑자기 수업노트가 없어졌습니다.
0
21
2
28:19 roc_auc이유
0
20
2
수강연장문의
0
23
2
전체적인 머신러닝 순서
0
24
2
빅분기 실기 유형2질문
0
26
1
ID 전처리 이유
0
31
2
데이터제공
0
33
2
예시문제 작업형3 꼬리질문2번
0
22
1
데이터 개수를 구할 때, len과 value_counts 차이
0
28
2
작업형 2 제출방
0
22
2
인코딩 스케일링 순서
0
24
2





