inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]

pandas 라이브러리로 실제 데이터 전처리하기4

파일 병합 질문 드립니다

300

miji.lee

작성한 질문수 11

0

강사님 안녕하세요.

마지막에 파일 병합하는 코드 질문 드립니다. (강의 9:15)

    first_doc = True

    for file in csv_list:

        doc = create_dateframe(file)

        if first_doc:

            final_doc, first_doc = doc, False

        else:

            final_doc = pd.merge(final_doc, doc, how='outer', left_index=True, right_index=True)

"first_doc=True면 첫 프레임을 지금 프레임으로 만들고, first_doc이 채워졌으니 False로 만든다. 

이후 final_doc이 기본 프레임이 된다."고 말씀하셨는데 이해가 안되서요. 

아니  if first_doc: final_doc, first_doc = doc, False 의 문법 자체를 모르겠습니다 ㅠㅠ 이건 어떤 원리로 작성된 코드인지요?

pandas python

답변 2

0

Hyoeun Yun

def generate_dateframe_by_path(PATH):

    file_list, csv_list = os.listdir(PATH), list()   

    first_doc = True

    for file in file_list:

        if file.split(".")[-1] == 'csv':  

            csv_list.append(file)

    csv_list.sort()  #sort() 기본 오름차순정렬

    

    for file in csv_list:      csv_list의 file들이 하나씩 차례로 들어올거고

        doc = create_dateframe(file)  그 파일들을 df으로 하나씩 만들고

        if first_doc:    처음들어온 doc이라면 우선 if구문이 실행될건데 

            final_doc, first_doc = doc, False   위에서 first_doc =True로 지정했던 상태로, fisrt_doc = False로 바꾸고, 이번에 들어온 doc을 final_doc에 저장해라

        else: 거고 그리고 다음 파일이 들어올 땐 fisrt_doc이 False이기 때문에 else문이 실행되고

            final_doc = pd.merge(final_doc, doc, how='outer', left_index=True, right_index=True)

         이번에 들어온 doc과 이전의 파일들이 저장된 final_doc을 합쳐서 새로운 final_doc을 생성

 

if 사과면:

  먹는다.

else: 

  먹지 않는다.

 

이런식으로 if else문을 설명하시더라구요. 초보입장에서 다른 초보분들한테 혹시 도움이 되지 않을까 해서 해석해봤습니다 ㅎ..ㅎ

 

0

잔재미코딩 DaveLee

안녕하세요.  제가 다음과 같이 작성을 한 것인지 의문이 조금 들어요.

여하튼 다음과 같이 쓰면, 앞에 선언된 것이 = 다음에 앞에 선언된 것으로 대입되고, 두번째 선언된 것이, = 다음에 두번째의 값에 대입이 됩니다. 이 부분은 영상에서 나올때마다 설명을 드리고 있어서, 영상을 다시 보셔도 좋을 것 같습니다.

final_doc, first_doc = doc, False

감사합니다.

Python 3 표시 없습니다.

0

52

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

65

1

구글 코랩과 아나콘다

0

79

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

95

1

COVID-19-master 관련 등 자료 누락

0

81

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

94

1

json.dumps관련된 질문

0

70

1

빅분기대비

0

111

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

92

1

강의자료 어디서 다운로드받나요?

0

137

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

96

1

iplot 에러 문제

1

199

1

플래그

0

74

1

플래그 라이브러리

0

82

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

177

1

CSV 파일 읽을 때 오류

0

189

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

135

1

강의 교재 및 실습 파일 제공되나요?

0

178

1

deep_data_and_visual 파일에서 에러가 납니다.

0

180

1

apply()함수

0

199

1

pandas groupby sum 질문

1

270

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

349

2

pandas_eda 힛맵에서 숫자가 안떠요

0

253

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

275

1