inflearn logo
강의

Course

Instructor

[Renewal] Python Data Analysis for Beginners (Easy! Master the entire process of preprocessing, pandas, and visualization) [Data Analysis/Science Part 1]

Preprocessing Real-World Data with the pandas Library 4

파일 병합 질문 드립니다

300

mijileekr1491

11 asked

0

강사님 안녕하세요.

마지막에 파일 병합하는 코드 질문 드립니다. (강의 9:15)

    first_doc = True

    for file in csv_list:

        doc = create_dateframe(file)

        if first_doc:

            final_doc, first_doc = doc, False

        else:

            final_doc = pd.merge(final_doc, doc, how='outer', left_index=True, right_index=True)

"first_doc=True면 첫 프레임을 지금 프레임으로 만들고, first_doc이 채워졌으니 False로 만든다. 

이후 final_doc이 기본 프레임이 된다."고 말씀하셨는데 이해가 안되서요. 

아니  if first_doc: final_doc, first_doc = doc, False 의 문법 자체를 모르겠습니다 ㅠㅠ 이건 어떤 원리로 작성된 코드인지요?

pandas python

Answer 2

0

Hyoeun Yun

def generate_dateframe_by_path(PATH):

    file_list, csv_list = os.listdir(PATH), list()   

    first_doc = True

    for file in file_list:

        if file.split(".")[-1] == 'csv':  

            csv_list.append(file)

    csv_list.sort()  #sort() 기본 오름차순정렬

    

    for file in csv_list:      csv_list의 file들이 하나씩 차례로 들어올거고

        doc = create_dateframe(file)  그 파일들을 df으로 하나씩 만들고

        if first_doc:    처음들어온 doc이라면 우선 if구문이 실행될건데 

            final_doc, first_doc = doc, False   위에서 first_doc =True로 지정했던 상태로, fisrt_doc = False로 바꾸고, 이번에 들어온 doc을 final_doc에 저장해라

        else: 거고 그리고 다음 파일이 들어올 땐 fisrt_doc이 False이기 때문에 else문이 실행되고

            final_doc = pd.merge(final_doc, doc, how='outer', left_index=True, right_index=True)

         이번에 들어온 doc과 이전의 파일들이 저장된 final_doc을 합쳐서 새로운 final_doc을 생성

 

if 사과면:

  먹는다.

else: 

  먹지 않는다.

 

이런식으로 if else문을 설명하시더라구요. 초보입장에서 다른 초보분들한테 혹시 도움이 되지 않을까 해서 해석해봤습니다 ㅎ..ㅎ

 

0

funcoding

안녕하세요.  제가 다음과 같이 작성을 한 것인지 의문이 조금 들어요.

여하튼 다음과 같이 쓰면, 앞에 선언된 것이 = 다음에 앞에 선언된 것으로 대입되고, 두번째 선언된 것이, = 다음에 두번째의 값에 대입이 됩니다. 이 부분은 영상에서 나올때마다 설명을 드리고 있어서, 영상을 다시 보셔도 좋을 것 같습니다.

final_doc, first_doc = doc, False

감사합니다.

Python 3 표시 없습니다.

0

54

1

강의실습 말고 강의에 대한 자료(pdf)가 없을까요?

0

66

1

구글 코랩과 아나콘다

0

80

1

강의와 다르게 오류가 뜨는 이유가 뭘까요?

0

97

1

COVID-19-master 관련 등 자료 누락

0

82

1

수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!

1

95

1

json.dumps관련된 질문

0

71

1

빅분기대비

0

112

1

파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문

0

93

1

강의자료 어디서 다운로드받나요?

0

138

1

pandas 라이브러리의 quotechar 인자에 대해 질문드립니다

0

98

1

iplot 에러 문제

1

200

1

플래그

0

75

1

플래그 라이브러리

0

83

1

CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련

0

179

1

CSV 파일 읽을 때 오류

0

191

1

read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이

0

136

1

강의 교재 및 실습 파일 제공되나요?

0

180

1

deep_data_and_visual 파일에서 에러가 납니다.

0

181

1

apply()함수

0

201

1

pandas groupby sum 질문

1

271

1

pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다

0

350

2

pandas_eda 힛맵에서 숫자가 안떠요

0

254

1

수업 자료에 pandas_basic 파일이 없습니다..!

0

276

1