inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

15) groupby 활용하여 다양한 데이터 집계를 활용하기

질문이 있습니다.

171

빛색감

작성한 질문수 3

1

Group Data 강의 중 shift 메소드에 대한 말씀을 해주신 것 중 만약 하나의 컬럼만 비어있는데 전의 값이나 후의 값으로 채우고 싶다고 한다면, 새로운 컬럼을 만들고 shift 값을 넣은 다음에 비어있는 값을 shift 값에서 가져오면 된다고 말씀을 해주셨습니다. 여기서 shift 값을 넣은 다음에 비어있는 값을 shift 값에서 가져오면 된다는 말씀이 이해가 되질 않습니다,,

python pandas

답변 1

2

박조은

안녕하세요. 시계열 데이터 등에서 중간에 비어있는 값이 있다면 비어있는 값을 그대로 사용하려고 하면 머신러닝이나 딥러닝 알고리즘 등에서 오류가 납니다. 이럴 때 이런 결측치를 어떻게 채워주느냐도 중요한 전처리 요소 중에 하나인데요. 값이 비어 있는 것을 채워주려고 할 때 일단 새로운 컬럼을 만들어서 shift 하면 지정한 위아랫값 등으로 데이터가 생길거에요. 그럼 기존 컬럼에서 예를 들어 df["컬럼명"].fillna(df["shift한 컬럼명"]) 을 넣어주면 이전 혹은 이후 값으로 결측치를 채울 수가 있습니다.  조금 더 간단하게 하고자 하면 interpolate를 사용하면 편하고 다음의 링크를 참고해 주세요. https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.interpolate.html

날짜변환 에러

0

260

0

업로드자료 오류

1

374

1

20강 관련 문의드립니다.

1

300

1

17강 도입부 실습사이트 문의

2

299

1

4강 코드 오류메세지 관련 질의

1

375

2

merge와 그룹바이 관련 질문이 있습니다.

1

494

3

쉬운 도서 추천 좀 부탁드립니다.

2

394

2

1강2강에 있는 csv파일을 다운받으면 한글이 깨져서 나와요

1

252

1

주피터노트북 목록(contents) 만들기

1

633

1

df.loc[df["거주지"].isin(gu), "지역"] = df["거주지"] 질문있습니다

1

208

1

월 주 함꼐 value_counts()

1

228

1

day_count.iloc[i]와 day_count[i]의 차이 질문

1

352

1

df 인덱싱 질문입니다

1

185

1

그래프에 한글제목을 나타내고 싶습니다.

1

535

1

배운 것 기반으로 만들어보고 있는데 질문이 있습니다.

1

404

5

질문이요

1

302

1

set_index()

1

288

1

timeit 관련 질문

1

363

1

그래프 밑에 제목을 넣으려면 어떡해야하나요???

1

421

2

한글폰트 설치 후 나오지 않는 현상 문의

1

1174

3

CSV 파일 불러오기

1

573

1

크롤링으로 csv파일 가져오기

2

320

1

영상에서 소개해주시는 웹사이트

2

261

1

질문

1

230

2