inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(ver. 2023)

전처리 질문입니다.

해결된 질문

180

sso03046

작성한 질문수 4

0

뭔가 알면 알수록 계속 욕심이 생깁니다..

(시험 때 어떻게든 score를 높이기 위해..)

총구매액, 최대구매액, 환불금액 같은 경우는 숫자가 너무나도 크기 때문에, StandardScaler를 쓰면 좋을 것 같아 보입니다.

 

StandardScaler는 그 해당 컬럼 값의 max값과 min값이

1000이상 차이나면 사용하면 좋을까요?

어떤 경우에 쓰면 좋을지 방향성을 알고 싶습니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

모든 전처리의 의사결정은

적용 후 모델 성능을 통해 판단합니다.

 

따라서 베이스라인을 빠르게 만든 후

그리고 나서 전처리를 하나씩 변경해 결과를 비교하는 방식을 추천합니다. 💪

0

sso03046

드라마틱한 차이는 없지만, 이런식으로 오르면 채택하고, 성능이 떨어지면 채택하지 않는 식으로 하면 된다는 거죠?

0

퇴근후딴짓

네 맞습니다

랜포나 라이트지비엠이 트리계열이라 스케일링 효과가 크지 않아요 미미한 수준

질문 드립니다.

0

38

2

강의 내용 관련 질문드립니다~

0

35

2

수강 연장 문의

0

33

1

강의자료 일괄 다운로드

0

43

2

수강기간 연장 문의드립니다

0

29

1

list 문제 질문드립니다~

0

31

2

빅분기 실기 12회 재도전

0

40

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

50

2

문제 3-2 질문드립니다

0

44

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

50

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

48

2

수강기간 연장 문의드립니다.

0

42

2

수강기한 연장 문의

0

80

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

45

2

수강기간 연장 문의드립니다.

0

71

2

수강연장 문의

0

77

2

수강연장문의

0

53

2