python pandas dataframe을 엑셀 vlookup처럼 활용하고 싶은데 쉽지 않습니다. 도와주세요

23.09.10 11:04 작성 조회수 610

0

하고 싶은 것

  • 일부 주문이 서비스 유형: 픽업임에도 배달메뉴코드로 생성되어 이를 찾고 싶습니다.
    (배달메뉴와 픽업메뉴 코드는 서로 다름)

  • 엑셀 vookup을 사용해서 상품코드를 배달 메뉴 테이블에서 검색하고, 검색되지 않으면 오주문으로 판단하는 코드를 구현했습니다.

  • 같은 프로그램을 파이썬을 통해 구현해보고 싶은데, 다른 dataframe에 없는 값을 찾아 행을 추가하는 과정이 어려워 조언을 구하고 싶습니다.

파이썬 코드

df_pickup = 픽업 주문내역 데이터 프레임
delivery_menu_code = df_delivery_menu["상품코드"]
df_misorder = pd.DataFrame()

# 픽업 주문내역에서 상품코드를 꺼내 해당 상품코드가 배달 메뉴 코드에 포함되어 있는지 확인
# 만약에 코드가 없으면 해당 row를 df_misorder에 추가

for idx, row in df_pickup.iterrows():
    misorder = df_delivery_menu[delivery_menu_code.str.contains(row["상품코드"], na = False)]

    if len(misorder) != 0:
        df_misorder.concat(row) 
    else:
        pass

# 어떻게 추가해도 계속 0개로 나와서, 도와주시면 감사드리겠습니다! 
len(df_misorder)

 

답변 1

답변을 작성해보세요.

0

인프런 AI 인턴님의 프로필

인프런 AI 인턴

2023.09.11

안녕하세요, 인프런 AI 인턴이에요.

문제를 해결해 드리겠습니다. 코드를 보니 concat 함수를 사용하는 부분에 문제가 있습니다. concat 함수를 사용하여 데이터프레임에 행을 추가하려면, concat 함수의 첫 번째 인자로 추가할 데이터프레임을 전달해야 합니다. 그리고 ignore_index=True 옵션을 설정하여 새로운 인덱스를 할당해야 합니다. 아래 코드를 참고하여 수정해보세요.

df_misorder = pd.DataFrame()

for idx, row in df_pickup.iterrows():
    misorder = df_delivery_menu[delivery_menu_code.str.contains(row["상품코드"], na=False)]

    if len(misorder) != 0:
        df_misorder = pd.concat([df_misorder, row.to_frame().T], ignore_index=True)
        
len(df_misorder)

이렇게 수정하면 df_misorder에 원하는 결과가 잘 추가될 것입니다. 추가로, df_delivery_menu의 “상품코드” 열에 중복된 값이 없다는 가정하에 코드가 작성되었습니다. 만약 중복된 값이 있다면, concat 함수로 인해 중복이 발생할 수 있습니다. 이 경우, drop_duplicates 함수를 사용하여 중복된 행을 삭제할 수 있습니다.

더 도움이 필요하시면 언제든지 물어보세요. 즐거운 프로그래밍 하세요!