[작업형2] data에 시계열 데이터가 있다면?

분류 또는 회귀 문제에서 컬럼 중 시계열 데이터가 있다면 어떻게 할 예정이세요?

여유가 된다면 파생변수(새로운 컬럼)를 만들어주세요

아래 코드는

  1. 시계열 데이터를 datetime 자료형으로 변환하고

  2. 년도, 월, 일을 새로운 컬럼으로 생성했어요.

  3. 그리고 기존 datetime컬럼은 삭제했습니다.

 

# datetime

train['datetime'] = pd.to_datetime(train['datetime'])
test['datetime'] = pd.to_datetime(test['datetime'])

train['year'] = train['datetime'].dt.year
train['month'] = train['datetime'].dt.month
train['day'] = train['datetime'].dt.day

test['year'] = test['datetime'].dt.year
test['month'] = test['datetime'].dt.month
test['day'] = test['datetime'].dt.day

train = train.drop('datetime', axis=1)
test = test.drop('datetime', axis=1)

함께 사용해 보시죠. 사용여부에 따라 모델 성능의 변화도 살펴보시죠!

https://www.kaggle.com/code/agileteam/t2-6-bike-regressor

 

 

kplane 프로필
kplane 8개월 전 datetime 컬럼을 오브젝트 타입 그대로 두고, LableEncoding 한게 성능이 좋은 것 같은데요. 실무적으로는 파생변수를 만들어서 학습하는게 일반적인 방법인가요?
채널톡 아이콘