9분경에 나오는 for file in csv_list 코드부분에서 질문이 있습니다.

Question

for file in csv_list:

doc = create_dateframe(file)

final_doc = pd.merge(final_doc, doc, how='outer', 이하생략)

final_doc = final_doc.fillna(0

return final_doc

이렇게 코드를 작성해도 되지 않을까?라는 생각이 들었는데, 굳이 if문을 거치는 이유가 무엇인가요?

Answer

안녕하세요. 답변도우미입니다.기본적으로는 동일한 기능을 하는 코드는 다양하게 작성이 가능합니다. 그래서 이야기하신 방안도 가능은 하지 않을까 생각합니다. 제시하신 코드 수정에서 주목해야 할 부분은 final_doc이 초기화되지 않았다는 것입니다. 첫 번째 file에서 pd.merge를 호출할 때 final_doc이 아직 정의되지 않았기 때문에 오류가 발생할 수 있습니다.원래 코드에서는 first_doc라는 플래그를 사용하여 첫 번째 파일의 경우 final_doc을 doc으로 초기화하고, 그 이후의 파일들에 대해서는 final_doc과 merge하는 방식을 사용하고 있습니다.제안하신 수정을 정상적으로 동작하게 하려면, final_doc의 초기 상태를 정의해주는 작업이 필요합니다. 아래는 수정된 코드의 예시입니다:final_doc = None  for file in csv_list:      doc = create_dateframe(file)            if final_doc is None:          final_doc = doc      else:          final_doc = pd.merge(final_doc, doc, how='outer', left_index=True, right_index=True)  final_doc = final_doc.fillna(0)  return final_doc이렇게 수정하면 첫 번째 file에서 final_doc이 None인 것을 확인하고 초기화하고, 그 다음부터는 기존 final_doc과 새로운 doc을 merge하게 됩니다. 따라서 위와 같이 수정하면 원래의 코드와 동일한 기능을 수행할 수 있습니다.감사합니다.

shara040217

9분경에 나오는 for file in csv_list 코드부분에서 질문이 있습니다.

이 글과 비슷한 Q&A

bfs 시간복잡도 관련 질문입니다!

현업에서 detection 시 데이터셋의 수가 어느정도 되야하나요?

Redis 연결중 import

3-4 수치형 - 민맥스 스케일링