Written on
·
213
0
안녕하세요 :)
강의를 잘듣고 있습니다. 5.9 Regression실습-Bike Sharing Demand 부분을 수행하다가
주신 코드대로 수행하였는데, 마지막 부분쯤에 원-핫 인코딩 후
coef = pd.Series(lr_reg.coef_ , index=X_features_ohe.columns)
coef_sort = coef.sort_values(ascending=False)[:10]
sns.barplot(x=coef_sort.values , y=coef_sort.index)
이 코드를 실행하였을때, 저는 seaseon이 아닌 year_2012, year_2011 피처가 가장 상위에 출력됩니다.
다른 평가 값이나 출력값은 같은 것 같은데 이 부분만 다른 이유가 무엇일까요,,
Answer 3
1
안녕하십니까,
해당 부분은 사이킷런 버전 upgrade후 결과가 변하는 것 같습니다.
제가 좀더 살펴보고 방법을 말씀드리겠습니다.
감사합니다.
0
안녕하십니까,
이 부분은 추후 강의 동영상의 수정이 필요할 것 같습니다.
현재 코드로는 year가 피처 상위에 출력이 됩니다.
year는 아예 삭제되어도 무방할 거 같습니다. 아니면 year를 one-hot encoding에서 삭제하는 것도 방법이지만, 그렇다고 season이 중요 feature로 올라오지는 않는군요.
X_features_ohe = pd.get_dummies(X_features, columns=['month','hour', 'holiday',
'workingday','season','weather'])
해당 부분은 다시 소스 코드및 강의 동영상을 수정한 뒤 전체 공지 하겠습니다.
감사합니다.
0