inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

파이썬 데이터 전처리 정리와 과제

최종정리 코드에 관하여 문의드립니다.

268

함문주

작성한 질문수 27

0

정리 강의라서 시간대를 말씀드리기가 애매한데요,

우선 정리해주신 코드 중에 첫번째에

각각 파일에 대해 작업할 때에 int64로 정수형으로 정리될 수 있도록 작성되어있습니다. 

그런데 세 번째 코드로 가시면 

보시는 것 처럼 다시 최종 파일 다루는 과정에서 다시 int64 를 적용하는데요, 실제로 저 단계 바로 직전에서 df_confirmed를 실행해보면 소숫점 데이터 값들이 나와있습니다.

왜 첫번째 코드에서 int64를 명시했는데, 다시 int64를 적용해야하는 상황이 나오는건가요??

번거로우실텐데 죄송합니다.. 

python pandas

답변 1

0

잔재미코딩 DaveLee

안녕하세요.

이 코드는 딱히 영상 어느 부분과 관련이 있는지 잘 모르겠어서, 예전 코드라 바로 이해는 안되네요. 

데이터를 생성하거나, 데이터를 파일로부터 읽을 때는, 해당 파일에 각 컬럼의 데이터 타입까지 지정하지는 않으니까요. 자동으로 데이터 타입이 변환되서, 읽혀질 수는 있어요. 그래서 그럴 경우에는 본래의 데이터 타입이든 아니든, 가볍게 명시적으로 정리하는 차원에서 데이터 타입을 명기할 수 있을 것 같습니다. 

몇몇 기능을 쓸 때, 특정 데이터 타입에서만 기능이 지원되는 경우가 있으니까요. 여러 데이터를 읽고, 해당 기능을 사용하다보면, 특정 파일이 다른 데이터 타입으로 명기될 수도 있으니까요. 아예 일괄적으로 파일을 읽을 때마다, 데이터 타입을 astype() 으로 설정을 해주면, 역시 이런 문제도 없어지는 것이니까요.

감사합니다.

Python 3 표시 없습니다.

0

71

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

86

1

구글 코랩과 아나콘다

0

102

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

114

1

COVID-19-master 관련 등 자료 누락

0

98

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

107

1

json.dumps관련된 질문

0

78

1

빅분기대비

0

117

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

99

1

강의자료 어디서 다운로드받나요?

0

148

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

105

1

iplot 에러 문제

1

209

1

플래그

0

79

1

플래그 라이브러리

0

90

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

183

1

CSV 파일 읽을 때 오류

0

201

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

138

1

강의 교재 및 실습 파일 제공되나요?

0

188

1

deep_data_and_visual 파일에서 에러가 납니다.

0

189

1

apply()함수

0

208

1

pandas groupby sum 질문

1

275

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

362

2

pandas_eda 힛맵에서 숫자가 안떠요

0

259

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

282

1