• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

Feature Selection관련

21.05.15 18:55 작성 조회수 111

0

안녕하세요. 요즘 강의 정말 잘 듣고 있습니다.

Feature Selection할 때, '피처를 하나씩 추가하고 변경해 가면서 성능이 좋지 않은 피처는 제거하도록 한다.'라고 하셨는데, 그래서 그런지 밑에 선생님이 적으신거 보니 

feature_names = ["season", "weather", "temp", "atemp", "humidity", "windspeed",

                 "year", "hour", "dayofweek", "holiday", "workingday"]

기존 feature 중에서 "month"를 빼셨더라구요.

그래서 "month"는 빼는게 성능이 더 좋아지나보다 했는데, 제가 "month" 한번 넣어봤더니 더 좋아지더라구요.

그래서 결론은 깜빡하시고 뺀건지, 아니면  그냥 제 경우에서만 이렇게 나온건지 궁금합니다.

그리고 추가적으로 피처를 변경해 가면서 성능을 확인하면 계속 30초씩 걸리는데, 원래 이런식으로 계속 돌려가면서 확인을 해야되는건가요? 그냥 몰라서 여쭤봅니다.

랜덤포레스트는 자체적으로 피처를 줄이니까 그냥 다 넣으면 안될까 해서요.

감사합니다.

답변 0

답변을 작성해보세요.

답변을 기다리고 있는 질문이에요.
첫번째 답변을 남겨보세요!