inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 2 모델학습

해결된 질문

199

inflearn

작성한 질문수 9

0

피쳐엔지니어링에서

가장 베이직한 방법이

범주형 데이터 - > 인코딩 진행 후 평가 하는 방법이 맞을까요

 

모델을 학습하는 여러가지 방법을 정리해보려고 하는데 맞는지 확인부탁드립니다 ㅠ ㅠ

데이터 : 범주형+수치형 데이터

  1. 범주형 인코딩 -> 모델학습 (범주형만 학습 )-> 평가

  2. 범주형 인코딩 -> 모델학습 (범주형+수치형 학습) - > 평가

  3. 수치형 스케일링 -> 모델학습 (수치형 )-> 평가

  4. 범주형 인코딩 + 수치형 스케일링 -> 모델학습 (범주형+수치형 학습)-> 평가

보통 1이랑 2중에 2을 일반적으로 많이 사용하나요?

그리고 다른 모델은 테스트 안해보고 랜덤포레스트만 사용하고 제출하게 되면 점수에 영향이 많이 미칠까요..?

보통 어떤 모델 사용하면 좋을지 추천 부탁드립니다 ㅠㅠ

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

  1. 2번과 4번을 사용하면 좋습니다. 1번과 3번은 문제가 있을 것 같아요!

  2. 랜덤포레스트와 lightgbm 추천드립니다.

시험 잘 보고 오세요 🙂

 

작업형2 카테고리

0

7

1

110강 회귀_8번 문의

0

8

2

XGBRegressor 학습 시 warning 출력

0

12

2

데이터 프레임을 변경해도 되나요?

0

10

2

10회 기출 작업형3 문제 2-1 질문

0

15

2

작업형 2 질문

0

14

2

작업형 2 템플릿 확인 요청

0

13

2

작업형2 인코딩 질문

0

22

2

작업형 3 벼락치기 공부방법 질문

0

30

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

31

2

예측값 결과 소수점 차이

0

28

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

35

1

전처리 train() test([ ])

0

23

2

작업형 1 배경지식 질문

0

32

2

옳게 풀은건지 질문드립니다!

0

22

1

roc_auc_score

0

29

2

추가질문 합니다

0

22

2

시험환경 구름

0

20

2

2유형 질문드려요

0

21

2

RandomForest vs lgb

0

28

2

전처리 관련질문

0

29

3

작업형3 기출

0

20

2

유형2에서 데이터분할 생략 가능여부

0

33

2

9회 기출 유형3 질문

0

21

2