인프런 커뮤니티 질문&답변

슝슝님의 프로필 이미지
슝슝

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

라이브러리 및 데이터 불러오기 그리고 EDA

Concat 문의

해결된 질문

작성

·

325

0

선생님 안녕하세요? 우선 좋은 강의 감사드립니다 ㅎㅎ 6.24 시험을 위해 막 듣기 시작했습니다 ㅎㅎ

오늘 강의 중 concat 개념이 나왔는데,

df = pd.concat([x_train, y_train[‘income’], axis = 1) 로 합치는 것 예시가 있었습니다.

여기서 궁금한 게 id 기준으로 합쳐야 할텐데, x_train의 id 컬럼과 y_train의 id 컬럼이 같은 것끼리 연결하라는 말이 없어서, 그냥 자동으로 id에 따라 연결해주는건지 궁금합니다.

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

안녕하세요:)

concat은 아래로 그대로 합치거나 (axis=0, 기본값)

옆으로 그대로 합치게 됩니다. (axis=1)

일반적으로는 제공된 X_train의 순서와 y_train의 순서가 동일합니다.
(작업형2에서 이런 상황을 만들진 않을 것 같습니다.)

 

질문주신 id에 따라 합치기 위해서는 merge (또는 join)을 활용합니다.

예시코드를 보여주면 아래와 같습니다. 이런형태가 출제된다면 작업형1이 좀 더 적합해 보여요 :) 화이팅입니다.

pd.merge(X_train, y_train, how='left', left_on='id', right_on='id')
슝슝님의 프로필 이미지
슝슝

작성한 질문수

질문하기