• 카테고리

    질문 & 답변
  • 세부 분야

    자격증 (데이터 사이언스)

  • 해결 여부

    해결됨

Concat 문의

23.05.29 17:04 작성 조회수 250

0

선생님 안녕하세요? 우선 좋은 강의 감사드립니다 ㅎㅎ 6.24 시험을 위해 막 듣기 시작했습니다 ㅎㅎ

오늘 강의 중 concat 개념이 나왔는데,

df = pd.concat([x_train, y_train[‘income’], axis = 1) 로 합치는 것 예시가 있었습니다.

여기서 궁금한 게 id 기준으로 합쳐야 할텐데, x_train의 id 컬럼과 y_train의 id 컬럼이 같은 것끼리 연결하라는 말이 없어서, 그냥 자동으로 id에 따라 연결해주는건지 궁금합니다.

답변 1

답변을 작성해보세요.

1

안녕하세요:)

concat은 아래로 그대로 합치거나 (axis=0, 기본값)

옆으로 그대로 합치게 됩니다. (axis=1)

일반적으로는 제공된 X_train의 순서와 y_train의 순서가 동일합니다.
(작업형2에서 이런 상황을 만들진 않을 것 같습니다.)

 

질문주신 id에 따라 합치기 위해서는 merge (또는 join)을 활용합니다.

예시코드를 보여주면 아래와 같습니다. 이런형태가 출제된다면 작업형1이 좀 더 적합해 보여요 :) 화이팅입니다.

pd.merge(X_train, y_train, how='left', left_on='id', right_on='id')