-
카테고리
-
세부 분야
자격증 (데이터 사이언스)
-
해결 여부
해결됨
Concat 문의
23.05.29 17:04 작성 조회수 250
0
선생님 안녕하세요? 우선 좋은 강의 감사드립니다 ㅎㅎ 6.24 시험을 위해 막 듣기 시작했습니다 ㅎㅎ
오늘 강의 중 concat 개념이 나왔는데,
df = pd.concat([x_train, y_train[‘income’], axis = 1) 로 합치는 것 예시가 있었습니다.
여기서 궁금한 게 id 기준으로 합쳐야 할텐데, x_train의 id 컬럼과 y_train의 id 컬럼이 같은 것끼리 연결하라는 말이 없어서, 그냥 자동으로 id에 따라 연결해주는건지 궁금합니다.
답변을 작성해보세요.
1
퇴근후딴짓
지식공유자2023.05.29
안녕하세요:)
concat은 아래로 그대로 합치거나 (axis=0, 기본값)
옆으로 그대로 합치게 됩니다. (axis=1)
일반적으로는 제공된 X_train의 순서와 y_train의 순서가 동일합니다.
(작업형2에서 이런 상황을 만들진 않을 것 같습니다.)
질문주신 id에 따라 합치기 위해서는 merge (또는 join)을 활용합니다.
예시코드를 보여주면 아래와 같습니다. 이런형태가 출제된다면 작업형1이 좀 더 적합해 보여요 :) 화이팅입니다.
pd.merge(X_train, y_train, how='left', left_on='id', right_on='id')
답변 1