• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

회귀 실습 -자전거 대여 수요 예측 원핫인코딩 관련질문

21.11.19 14:43 작성 조회수 174

0

안녕하세요 강의 너무 잘듣고 있습니다
회귀 실습 - 자전거 대여수요 예측에서
 
선형 회귀의 경우 원핫 인코딩이 필수라 하셨는데 ,
숫자형 값을 원핫 인코딩으로 변경하는 이유가 궁금합니다.
 
(대략적으로 회귀계수에 숫자는 영향을 많이 주기때문이라는데 , 구체적으로 설명 부탁드립니다.)
 
그리고 예제에서는 원핫인코딩 적용 컬럼이 전부다 적용안하고
'year','month','day','hour','holiday','workingday','season','weather'
 
만 적용되는지 궁금합니다.

답변 1

답변을 작성해보세요.

0

안녕하십니까, 

선형 계열에서 원핫 인코딩이 필수라기 보다는 성능 개선이 될 수 있는 여지가 타 계열 ML 알고리즘보다는 많다는 정도로 인지해 주시면 될 것 같습니다. 

그리고 위 Feature 에 적용한 이유는 해당 feature들의 값 자체는 숫자이지만, feature 형태로는 카테고리 값이기 때문입니다. 가령 month의 경우 1월, 2월, 3월.... 과 같이 숫자 1, 2, 3 으로 되어 있더라도 숫자 3이 숫자1보다 크다는 의미를 가지고 있지 않습니다. 단지 월을 구분하기 위한 값입니다. 

감사합니다.