인프런 커뮤니티 질문&답변

함문주님의 프로필 이미지
함문주

작성한 질문수

처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part2]

파이썬 데이터 전처리 정리와 과제

최종정리 코드에 관하여 문의드립니다.

작성

·

195

0

정리 강의라서 시간대를 말씀드리기가 애매한데요,

우선 정리해주신 코드 중에 첫번째에

각각 파일에 대해 작업할 때에 int64로 정수형으로 정리될 수 있도록 작성되어있습니다. 

그런데 세 번째 코드로 가시면 

보시는 것 처럼 다시 최종 파일 다루는 과정에서 다시 int64 를 적용하는데요, 실제로 저 단계 바로 직전에서 df_confirmed를 실행해보면 소숫점 데이터 값들이 나와있습니다.

왜 첫번째 코드에서 int64를 명시했는데, 다시 int64를 적용해야하는 상황이 나오는건가요??

번거로우실텐데 죄송합니다.. 

답변 1

0

안녕하세요.

이 코드는 딱히 영상 어느 부분과 관련이 있는지 잘 모르겠어서, 예전 코드라 바로 이해는 안되네요. 

데이터를 생성하거나, 데이터를 파일로부터 읽을 때는, 해당 파일에 각 컬럼의 데이터 타입까지 지정하지는 않으니까요. 자동으로 데이터 타입이 변환되서, 읽혀질 수는 있어요. 그래서 그럴 경우에는 본래의 데이터 타입이든 아니든, 가볍게 명시적으로 정리하는 차원에서 데이터 타입을 명기할 수 있을 것 같습니다. 

몇몇 기능을 쓸 때, 특정 데이터 타입에서만 기능이 지원되는 경우가 있으니까요. 여러 데이터를 읽고, 해당 기능을 사용하다보면, 특정 파일이 다른 데이터 타입으로 명기될 수도 있으니까요. 아예 일괄적으로 파일을 읽을 때마다, 데이터 타입을 astype() 으로 설정을 해주면, 역시 이런 문제도 없어지는 것이니까요.

감사합니다.

함문주님의 프로필 이미지
함문주

작성한 질문수

질문하기