강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

코드몽키님의 프로필 이미지
코드몽키

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

시계열 관련 부분은 책에서 어디를 보면 좋나요?

작성

·

385

0

1. 시계열 관련 부분은 책에서 어디를 보면 좋나요?

2. submission 횟수가 제한된 대회에 참가중인데  (RMSE)

보통 이런경우 성능개선을 위해서는 저자님은어떻게 하시나요?

(RMSE 코드 짜서 넣어도 RMSE 지표로는 향상되었지만, 제출시 오히려 지표가 낮게 나오는 경우가 있어서요)

3. ARIMA, MA 같은 시계열 관련 kernel이나 사이트 아시는 곳 있으시면, 알려주시면 큰 도움 될거 같습니다. 

감사합니다.

답변 2

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

1. 아쉽지만 제 책에는 시계열 관련 부분은 없습니다.

2. 만일 오프라인 경연 대회가 아니라 캐글과 같은 온라인 경연대회라면 주위 사람들에게 계정 생성을 요청해서 4~5개 계정으로 번갈아서 Submission하거나 팀을 이룬 뒤, 팀 개인이름으로 Submission하면서 튜닝을 하는 방법이 있습니다.

그런데 오프라인 경연 대회이고, 팀 단위로 Submission이 제약되는 경우는 Cross-validation을 보다  다양하게 수행하는 것 외에는 다른 방법이 생각 나지 않습니다.  만일 Cross-validation 평균 성능은 잘 나왔는데, 테스트 데이터 기반의 성능은 여전히 향상 되지 않는 경우에는 테스트 데이터에 아웃라이어 등이 있는지 짐작하여 이를 회피하는 방식등을 고려해야 할 것입니다. 

3. 구글링 해보시면 쉽게 시계열 자료를 찾으실 수 있을 것입니다만 아래와 같은 URL을 먼저 권장 드립니다.

https://machinelearningmastery.com/arima-for-time-series-forecasting-with-python/

https://www.kaggle.com/sumi25/understand-arima-and-tune-p-d-q

https://towardsdatascience.com/time-series-in-python-exponential-smoothing-and-arima-processes-2c67f2a52788

감사합니다.

0

코드몽키님의 프로필 이미지
코드몽키
질문자

친절한 답변 감사합니다. 

다음에 캐글 관련 도서 집필해주실때 시계열쪽도 다루어 주시면 저같은 초보들에게 큰 도움 될거 같습니다.

항상 좋은 강의 올려주셔서 감사합니다 

오늘도 좋은하루 보내세요 :)

코드몽키님의 프로필 이미지
코드몽키

작성한 질문수

질문하기