해결된 질문
작성
·
277
0
안녕하세요. 데이터를 불러오는 것 조차 못하던 제가 지금은 어느 정도 작업을 수행하고 있네요..ㅎ
갑사합니다!!
작업형 2번 concat에 관해 여쭙고 싶은게 있어서 질문드립니다.
train,test (2개의 데이터가 주어진 경우 / train, test 컬럼에서 내용이 다를 때 인코딩)
df=pd.concat([train, test],axis=0) 후 인코딩 하고
분리 : train=df[:train,shape[0]].copy()
test=df[train,shape[0]:].copy() 이렇게 하는 것은 알고 있습니다.
<질문>그러면 데이터가 3개(X_train, Y_train ,test)이렇게 주어진 경우
train=pd.concat([X_train, Y_train],axis=1)로 변경하고 작업을 계속 해도 무방한가요?
아니면 다시 분리를 해줘야 하나요? 또 분리를 해야한다면 코드도 궁금합니다!
또한, 위에 1번에서는 axis=0을 한게 컬럼이 동일 하기 때문에 행으로 합친것이고
2번에서 axis=1로 한 것은 옆에다(열 쪽으로) 합쳐야 하기 때문에 그런거겠죠?!
답변 1
1
2개가 주어질 것으로 거의 예상됩니다.
3개가 주어졌던 경우 y_train에는 id와 target이 포함되어 있었기 때문에 pd.concat([X_train, Y_train['target']],axis=1)이나 X_trian['target'] = y_train['target']으로 대입해도 됩니다.