Resolved
Written on
·
172
0
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
age 칼럼의경우 20대 30대 40대 이렇게 나누는 이유가
있을까요?
또 그렇게 범주형으로 나누려면 어떻게 코드를
작성해야할지 궁금합니다!!
Answer 1
0
연속형 변수를 범주형 변수로 변환하는 것은 피처엔지니어링 방법중에 하나입니다.
모델 성능향상을 위해 작업하기도 합니다. 작업형2에서는 이런 피처 생성까진 요구하고 있지 않았어요!
설명은 드릴 수 있는데 작업 방법은 다양하고, 적용은 학습자의 몫입니다.
import pandas as pd
data = {'age': [25, 35, 45, 55, 65]}
df = pd.DataFrame(data)
df['age_group'] = pd.cut(df['age'], bins=[0, 29, 39, 49, 59, 69], labels=['20대 이하', '30대', '40대', '50대', '60대 이상'], right=False)
print(df)
화이팅입니다 🙂