inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

3회 기출유형(작업형2)

스케일링

해결된 질문

407

눈누난나

작성한 질문수 8

0

안녕하세요. 자료에 따라 스케일링을 다르게 쓰시는 것 같은데요.

일단 실기시험을 준비하는 입장에서는 어느 경우에 스탠다드, 민맥스, 로버스트 등을 쓰는지 잘 이해가 가지 않네요.

강사님게서 쓰시니까 그런가보다,, 하고 쓰긴 하는데 시험에서는 민맥스 스케일링 하나만 이해하고 사용해도 문제가 없을까요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

안녕하세요!
데이터 전처리 기준은
1. 베이스라인 (기본) 모델을 먼저 만들고
2. 전처리를 하나씩 해보고 베이스라인과 전처리 작업한 모델의 검증데이터 평가를 기준으로 비교하면 명확합니다.
어떤 스켈러를 써야할지 비교해보고 성능좋은 것을 선택하면 됩니다💪

- 인코딩(레이블, 원핫)은 필수 이고 (범주형 -> 수치형)
- 스켈러는 선택이라 생각해주세요 :) 그래서 하나만 알고 계셔도 됩니다. 3개를 비교해도 미미한 차이가 될거에요~

문제에 첨부된 예시와 실제 출력된 샘플 비교

0

3

1

원핫 인코딩 관련

0

7

1

타겟 분리

0

6

1

Id 삭제

0

7

1

roc_auc_score 질문: 작업형2 모의문제3 09분 48초

0

11

1

원핫인코딩 코드 질문

0

11

1

map 함수 사용 필수적인가요

0

15

1

수강 기한 연장 문의드립니다.

0

19

1

34강 평가지표

0

24

2

103강 작업2형 전처리(레이블인코딩 부분) 오류

0

16

2

작업형1_section14 문의

0

14

2

작업형1_연습문제 7번 관련입니다.

0

16

2

데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.

0

17

2

크로스 밸리데이션 질문

0

21

2

로지스틱 회귀분석 질문

0

18

2

수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?

0

24

2

2유형 object 컬럼 인코딩 관련 질문

0

35

2

하이퍼파라미터 변수

0

32

2

52강 이원분산분석

0

27

2

실제시험환경에서 작업형1,2,3의 문제풀이 순서

0

34

2

독립표본검정

0

27

2

tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??

0

40

2

df.describe() 사용을 자제해야할까요?

0

38

2

shape 결과에 대한 문의

0

40

2