inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

공공데이터로 파이썬 데이터 분석 시작하기

수강 중 질문사항

224

tkdahr741

작성한 질문수 2

1

안녕하세요! 좋은 강의 너무 잘 듣고있습니다! 다름이 아니라 split함수를 사용해서 YYYY-MM-DD형식을 연월일로 나누는 것은 잘 이해했습니다! 제가 따로 실습을 하려 다른 데이터를 사용하고 있는데 YYYYMMDD처럼 중간에 상용구 없이 붙은 경우에는 연월일을 어떻게 분리할수있을까요? 답변부탁드리겠습니다!

pandas numpy python

답변 3

1

tkdahr741

감사합니다!

1

박조은

안녕하세요.

split으로 나누는 방법도 있지만 pd.to_datetime 을 사용해서 변경해 보실 수도 있어요. 

YYYYMMDD 처럼 되어 있다면 일단 데이터 타입을 먼저 확인해 주셔야 해요.

int 타입인데 연월일일때 pd.to_datetime 을 사용하면 타임스탬프라는 형식으로 이해해서 원하는 대로 변경이 되지 않습니다.

데이터 타입을 object  형식으로 우선 변경이 필요하고요.

해당 컬럼명이 "날짜"라고 가정하고 df 라는 변수에 데이터프레임으로 들어있다고 가정한다면

다음과 같이 날짜 타입으로 변경해서 원하는 형태의 데이터를 추출해 보실 수 있습니다.

df["날짜"] = pd.to_datetime(df["날짜"].astype(str))

연도추출  => df["날짜"].dt.year

월추출  => df["날짜"].dt.month

날짜추출  => df["날짜"].dt.day

또, 위 방법을 사용하지 않고 split을 사용한다면

df["날짜"] = df["날짜"].astype(str)

아래와 같은 슬라이싱 방법을 사용하실 수도 있습니다.

df["날짜"].str[:4]

0

박조은

감사합니다 :)

패키지 설치 에러 ydata-profiling

0

120

2

자세한 설명 부탁드려요 ㅜ

0

176

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

286

2

value_counts와 count 차이

0

341

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

205

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

188

2

에러 메시지

1

303

2

그래프 색이 동일하게 나옵니다.

0

308

2

시각화 라이브러리 비교

0

382

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

687

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

get_string함수에서 문자 'nan'

0

200

1

seaborn X축 시작 지점 조정 질의의 건

0

213

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

477

1

corr = df.corr() 입력시 오류

1

372

1

keyword grid_b is not recognized

0

334

1

%ls data 매직커맨드 사용시 한글 깨짐

0

292

1