강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của dkssud24421850
dkssud24421850

câu hỏi đã được viết

Tìm hiểu khoa học dữ liệu thông qua thực hành Kaggle

Sử dụng rừng ngẫu nhiên

Feature Selection관련

Viết

·

189

0

안녕하세요. 요즘 강의 정말 잘 듣고 있습니다.

Feature Selection할 때, '피처를 하나씩 추가하고 변경해 가면서 성능이 좋지 않은 피처는 제거하도록 한다.'라고 하셨는데, 그래서 그런지 밑에 선생님이 적으신거 보니 

feature_names = ["season", "weather", "temp", "atemp", "humidity", "windspeed",

                 "year", "hour", "dayofweek", "holiday", "workingday"]

기존 feature 중에서 "month"를 빼셨더라구요.

그래서 "month"는 빼는게 성능이 더 좋아지나보다 했는데, 제가 "month" 한번 넣어봤더니 더 좋아지더라구요.

그래서 결론은 깜빡하시고 뺀건지, 아니면  그냥 제 경우에서만 이렇게 나온건지 궁금합니다.

그리고 추가적으로 피처를 변경해 가면서 성능을 확인하면 계속 30초씩 걸리는데, 원래 이런식으로 계속 돌려가면서 확인을 해야되는건가요? 그냥 몰라서 여쭤봅니다.

랜덤포레스트는 자체적으로 피처를 줄이니까 그냥 다 넣으면 안될까 해서요.

감사합니다.

kaggle

Câu trả lời

Câu hỏi này đang chờ câu trả lời
Hãy là người đầu tiên trả lời!
Hình ảnh hồ sơ của dkssud24421850
dkssud24421850

câu hỏi đã được viết

Đặt câu hỏi