• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

7회/ 작업형2번 문의(lightgbm)

23.12.04 10:28 작성 조회수 262

0

안녕하세요

이번 7회 작업형 2번관련하여 문의를 아래와 같이 드립니다

< 문의내용 >

1. 회귀 / 분류 중에 어떤 문제 였는지 ?

  • lightgbm regression 으로 문제를 풀이 하였는데,

  • "데이터전문가포럼' 네이버 카페에서 조회하니 랜덤포레스트 classifier 로 문제를 풀이 하는 분들이 있어서

  • 제가 완전히 틀린 것인가 싶어서 문의드립니다

 

2. regression으로 문제를 풀이하고, pred를 작성하였는데

  • 예측하는 값이 amount(금액) 값이 '- 값이 발생' 해도 문제가 없는지 ?

  • 상식선에서는 예측하는 값이 amount의 경우는 무조건 양의 값이 나와야 하는데, '음수 값이 발생해서 의문'

 

<예상구성코드>

*amount 값을 예상하는 내용

*train / test 2개 파일만 제공하였음

 

train Set에서 POP

  • amount 값에 대해서 target으로 변경하여 pop 처리

lebel Encoding

Model_Selection > train_test_split

Lightgbm-regression

  • max_depth / N_estimater / Learning Rate 만 조절

Sklearn > metrics > MSE

  • MSE ** 0.5 로 RMSE 구성

 

 

 

 

답변 1

답변을 작성해보세요.

0

안녕하세요!!

1

정상적으로 풀이했어요! 회귀문제가 맞습니다 RMSE는 회귀 평가지표에요~~

분류 모델로 풀이를 했다면 잘못되었습니다.

2

기존 train 기초통계값을 확인했을 때 음수값이 있었는지가 중요할 것 같네요!

음수값이 원래 있었다면 큰 문제 없습니다. 해당 도메인에서 음수값을 나타내는 일들이 있을 것 같아요!

고생 많으셨습니다 🙂