작성
·
279
0
현재 대회에 참가중인데, 분류문제에서 lightgbm이 효과가 좋다고 하여서, 해보았습니다.(다중분류문제입니다)
근데 제출 할 csv 파일에 컬럼값이 18개가 되어야 하는데
lightgbm 을 쓰면 1개만 생기더라구요.
주최측에서 예제로준 랜덤포레스트를 쓰면 컬럼값이 잘 생기던데, lightgbm 을 쓰면 계속 1개의 시리즈값만 뜨니
답답합니다ㅠㅠ 아직 초보라서 잘 모를수도 잇는데, 혹시 해결방법이 있을지요...
랜덤포레스트에서의 shape 은
input) y_pred = forest.predict_proba(test_x)
input) test_x.shape
output) (10009, 21)
input) y_pred.shape
output) (10009,19)
lightbgm 에서의 shape 는
input) pred=lgbm_wrapper.predict(test)
input) test.shape
output) (10009, 20) (여기서는 랜덤포레스트에서 id 값만 뺏습니다)
input) pred.shape
output) (10009,)
이어서 왜 시리즈값으로 나오는지 잘 모르겠습니다
답변 2
0
0
안녕하십니까,
pred=lgbm_wrapper.predict(test) 를 pred=lgbm_wrapper.predict_proba(test)로 변경해 보시겠습니까?
위의 random forest는 predict_proba() 인데 lgbm은 predict() 이군요.
감사합니다.