비전공자, 입문자가 빅데이터 분석기사 실기를 빠르게 취득할 수 있도록 안내해드려요! 꼭 필요한 파이썬, 판다스, 머신러닝을 다루고 있어요!
[작업형2] data에 시계열 데이터가 있다면?
분류 또는 회귀 문제에서 컬럼 중 시계열 데이터가 있다면 어떻게 할 예정이세요?
여유가 된다면 파생변수(새로운 컬럼)를 만들어주세요
아래 코드는
시계열 데이터를 datetime 자료형으로 변환하고
년도, 월, 일을 새로운 컬럼으로 생성했어요.
그리고 기존 datetime컬럼은 삭제했습니다.
# datetime
train['datetime'] = pd.to_datetime(train['datetime'])
test['datetime'] = pd.to_datetime(test['datetime'])
train['year'] = train['datetime'].dt.year
train['month'] = train['datetime'].dt.month
train['day'] = train['datetime'].dt.day
test['year'] = test['datetime'].dt.year
test['month'] = test['datetime'].dt.month
test['day'] = test['datetime'].dt.day
train = train.drop('datetime', axis=1)
test = test.drop('datetime', axis=1)
함께 사용해 보시죠. 사용여부에 따라 모델 성능의 변화도 살펴보시죠!
https://www.kaggle.com/code/agileteam/t2-6-bike-regressor