인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

Inflearn Community Q&A

daiisy's profile image
daiisy

asked

[Revised Edition] The Complete Guide to Python Machine Learning

5.9 Regression실습-Bike Sharing Demand 에 관한 질문드립니다.

Written on

·

213

0

안녕하세요 :)

강의를 잘듣고 있습니다. 5.9 Regression실습-Bike Sharing Demand 부분을 수행하다가

주신 코드대로 수행하였는데, 마지막 부분쯤에 원-핫 인코딩 후

coef = pd.Series(lr_reg.coef_ , index=X_features_ohe.columns)

coef_sort = coef.sort_values(ascending=False)[:10]

sns.barplot(x=coef_sort.values , y=coef_sort.index)

이 코드를 실행하였을때, 저는 seaseon이 아닌 year_2012, year_2011 피처가 가장 상위에 출력됩니다.

다른 평가 값이나 출력값은 같은 것 같은데 이 부분만 다른 이유가 무엇일까요,,

python통계머신러닝 배워볼래요?

Answer 3

1

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

해당 부분은 사이킷런 버전 upgrade후 결과가 변하는 것 같습니다.

제가 좀더 살펴보고 방법을 말씀드리겠습니다.

감사합니다.

0

dooleyz3525님의 프로필 이미지
dooleyz3525
Instructor

안녕하십니까,

이 부분은 추후 강의 동영상의 수정이 필요할 것 같습니다.

현재 코드로는 year가 피처 상위에 출력이 됩니다.

year는 아예 삭제되어도 무방할 거 같습니다. 아니면  year를 one-hot encoding에서 삭제하는 것도 방법이지만, 그렇다고 season이 중요 feature로 올라오지는 않는군요.

X_features_ohe = pd.get_dummies(X_features, columns=['month','hour', 'holiday',
                                              'workingday','season','weather'])

해당 부분은 다시 소스 코드및 강의 동영상을 수정한 뒤 전체 공지 하겠습니다.

감사합니다.

0

daiisy님의 프로필 이미지
daiisy
Questioner

네 답변 기다리겠습니다 :)

daiisy's profile image
daiisy

asked

Ask a question