inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

캐글 T2-6 질문있습니다.

해결된 질문

156

whhw2123

작성한 질문수 1

0

안녕하세요,

공지로 알려주신 캐글 T2-6(시계열데이터가 있는 문제)를 풀고 있는데요!

모델 학습을 하는 과정에서

모델 별 평가 점수가 너무 크게 차이 나서 문의드립니다.

 

우선 풀이와 조금 다른점이 있다면 , 전처리 과정에서 datetime의 년,월,일 뿐만 아니라 시,분,초까지 칼럼으로 추가했다는 점입니다.

train.head()

선형회귀로 학습했을 때)

RMSE : 141.97306616836775

R2 : 0.39335324789512727

랜덤포레스트로 학습했을 때)

RMSE : 44.64624546594813 (하이퍼파라미터 튜닝x)

R2 : 0.9400079312167055

 

모델을 선형회귀로 학습했을 때랑 랜덤포레스트로 학습했을 때 점수차이가 너무 크게 나는데

뭔가 잘못된 부분이 있는걸까요..?

풀이의 모델들 점수가 오히려 선형회귀모델과 비슷한 0.4 정도가 나오는 것으로 보여서

이렇게 유난히 높게 나오는 랜덤포레스트 모델을 선택해도 괜찮은 것인지 궁금합니다.

확인 부탁드립니다!

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

네, 랜덤포레스트 사용하면됩니다.

선형회귀 모델은 예측을 제대로 하지 못하는 상황이네요

추천 모델은

  1. 랜덤포레스트

  2. lightgbm을

    추천합니다. 응원합니다 🙂

1

whhw2123

초스피드 답변 너무 감사합니다!!🙂

로지스틱회귀, 회귀

0

2

1

회귀 문제를 풀때 질문입니다.

0

13

1

불균형 처리 후 성능이 더 낮아졌다면,

0

26

2

실기 체험 제2유형 에러 문의

0

26

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

21

2

3번문제 등분산 가정

0

27

2

작업형3 target 형 변환 질문

0

25

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

20

3

원핫인코딩과 레이블 인코딩에서 concat

0

34

2

제2유형 질문입니다.

0

37

2

C()

0

34

2

작업형 2에서 strafity 적용 유무

0

36

2

수강 기간 연장 가능 여부 문의드립니다.

0

40

1

ols

0

32

2

2유형 작성관련 질문(일반 심화)

0

27

2

2유형 작성관련 질문

0

25

2

2유형 object컬럼 개수 다르면

0

33

2

코딩팡질문이요ㅠㅠ

0

33

2

관찰값과 기대값의 개념이 헷갈립니다.

0

17

2

작업형2 ID 컬럼 삭제 질문

0

33

2

2유형 작성관련 질문

0

23

2

memoryerror 질문

0

19

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

33

1

ID 삭제 필수 인가요?

0

31

3