inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

회귀 실습 1: 자전거 대여(공유) 수요 예측 -02 수업중 질문있습니다!

189

greentea1495

작성한 질문수 3

0

제가 기초수준이라 개념이 확실하지 않아 헷갈려서 질문합니다!

 

13:51초 경에서 LinearRegression 모델로 성능 평가한 뒤, 선생님께서 모델 학습을 했으니 피쳐 중요도를 보겠다고 말씀하시는 부분이 있는데, 그 뒤에 설명해주시는 객체가 coef_ 입니다ㅠ

 

질문입니다!

1. 피쳐 중요도는 feature_importance_ 이고, 분류모델과 트리계열 Regressor 모델에서만 확인 가능한 객체 아닌가요?

2. coef_(회귀계수)도 피처 중요도라고 이야기할 수 있는건가요? 아니면 회귀 계수를 말씀하시려던게 잠깐 잘못말씀하신건가요?

3. 상관계수와 피쳐 중요도는 어떤 차이가 있는건가요?

 

추가질문 드립니다.

제가 예전에 공부하면서, 다양한 scaling이나 정규화에 대해서 공부할때  테스트데이터에 대해서는 스케일링을 진행하면 안되고 오직 Train 데이터셋에서만 스케일링을 진행하고 학습해야 된다고 들었었습니다. 그런데 수업에서 모델 예측할때 log1p()된 X_test를 그대로 이용해서 prediction하는 것을 본것 같습니다.

수업에서도 설명해주셨듯, 이후 예측된 값들을 다시 expm1()함수를 이용해서 원상태로 복구만 시켜주면 테스트데이터에 대해서는 스케일링된 데이터를 사용하지 않았다고 생각할 수 있는것인가요?

 

ps. 강의 너무 잘 보고 공부하고있습니다!! 머신러닝 다 공부하고나면 CNN 강의도 결제해서 공부하려합니다 ㅎㅋㅋ!

통계 python 머신러닝 배워볼래요?

답변 1

1

권 철민

안녕하십니까, 

강의 잘 보고 계시다니 저도 기쁩니다. 

저는 선형 회귀이니까, 회귀 계수가 어느정도 되는지를 보자는 의미를 문맥적으로 피처 중요도를 보자고 한것인데, 설명을 듣고 보니 충분히 헷갈리실 수 있겠군요. 

피처 중요도가 어떤 트리 기반 모델에서만 사용하는 고유 명사가 아니라 피처가 어느정도 중요한것인지를 보자는 의미였습니다.  그래서 선형회귀에서는 회귀 계수를 살펴보자는 의미로 전달드린 것이었습니다.  그렇게 이해 부탁드립니다. 

그리고 테스트 데이터에 스케일링을 적용하면 안된다는 의미가 아니라 MinMaxScaler나 StandardScaler 객체를 이용해서 테스트 데이터에 스케일링을 적용할 때 학습 데이터 기반으로 fit()된 MinMaxScaler 객체를 이용하여 테스트 데이터를 transform()을 적용해야 한다는 의미 였습니다. 그러니까, 테스트 데이터로 fit()호출하지 말라는 것이었습니다.  해당 개념은 중요한 사항이니 섹션 2의   데이터 전처리 - 스케일링-02 영상을 참조하여 이해 부탁드립니다. 

감사합니다. 

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

56

2

안녕하세요 열심히 수강중인 학생입니다

0

93

2

정수 인덱싱

0

86

2

넘파이 오류

0

115

2

11강 numpy의 axis 축 질문 드립니다.

0

109

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

98

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

81

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

83

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

5강 강의 오류가 있어요.

0

90

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

81

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

79

3

파이썬 다운그레이 후 사이킷런 재설치

0

131

2

좋은 강의 감사합니다.

0

82

2

scoring 함수 음수값

0

76

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

108

2

분류 평가 정확도 예측

0

90

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

114

1

카카오톡 채널 있나요

0

119

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

195

2

pca 스케일링 관련하여 질문드립니다.

0

109

2

주피터 대신 구글 코랩

0

184

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

156

2

실루엣 스코어..

0

93

2