inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

작업형 2 인코딩, 결측치, 모델 선택 질문

9

seoby0512

3 câu hỏi đã được viết

0

# 레이블 인코딩, 랜덤포레스트: 807.8000397227841

# 원핫 인코딩, 랜덤포레스트: 819.45688399024339

# 레이블 인코딩, lgb: 779.846084731424

# 원핫 인코딩, lgb: 786.6443289033147

# 모델은 lgb로 선택

# 모델 선택 후 튜닝, 결측치 처리 유무, 인코딩 유무 확인하며 성능 비교하기

# 튜닝 X -> 더 높아짐

# 결측치 0으로 처리, 카테고리로 인코딩: 772.4958384891883

# 결측치 처리 X, 카테고리 인코딩: 768.6458172187305

# 결측치 처리 X, 레이블 인코딩: 782.66052200386

# 결측치 0으로 처리, 레이블 인코딩: 779.8460847311424


위의 과정을 거쳐 lgb모델, 결측치 처리 X, 카테고리 인코딩으로 선택하여 진행하였는데, 이렇게 하는 것이 맞는지 확인차 질문드립니다 !!!

그리고, 다 선택 후, train, target 전체 데이터로 재학습 후 test 예측하는 것이 더 좋을지 질문드립니다 !

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 0

test 재학습 관련

0

2

1

target 빈도 확인

0

6

1

작업형 2 연습문제 섹션 6

0

3

1

F1-score

0

7

1

작업형 2번 섹션 3

0

8

1

인코딩 방식 문의

0

10

1

9회 3유형 ==> 7회 3유형 질문드려요

0

6

1

작업형 2관련 질문입니다

0

10

2

작업형2 카테고리

0

17

2

110강 회귀_8번 문의

0

11

2

XGBRegressor 학습 시 warning 출력

0

20

2

데이터 프레임을 변경해도 되나요?

0

11

2

10회 기출 작업형3 문제 2-1 질문

0

18

2

작업형 2 질문

0

18

2

작업형 2 템플릿 확인 요청

0

17

2

작업형2 인코딩 질문

0

23

2

작업형 3 벼락치기 공부방법 질문

0

32

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

33

2

예측값 결과 소수점 차이

0

28

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

37

1

전처리 train() test([ ])

0

23

2

작업형 1 배경지식 질문

0

33

2

옳게 풀은건지 질문드립니다!

0

23

1

roc_auc_score

0

31

2