인프런 커뮤니티 질문&답변
질문이 있습니다.
작성
·
168
답변 1
2
박조은
지식공유자
안녕하세요. 시계열 데이터 등에서 중간에 비어있는 값이 있다면 비어있는 값을 그대로 사용하려고 하면 머신러닝이나 딥러닝 알고리즘 등에서 오류가 납니다. 이럴 때 이런 결측치를 어떻게 채워주느냐도 중요한 전처리 요소 중에 하나인데요. 값이 비어 있는 것을 채워주려고 할 때 일단 새로운 컬럼을 만들어서 shift 하면 지정한 위아랫값 등으로 데이터가 생길거에요. 그럼 기존 컬럼에서 예를 들어 df["컬럼명"].fillna(df["shift한 컬럼명"]) 을 넣어주면 이전 혹은 이후 값으로 결측치를 채울 수가 있습니다. 조금 더 간단하게 하고자 하면 interpolate를 사용하면 편하고 다음의 링크를 참고해 주세요. https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.interpolate.html





