인프런 커뮤니티 질문&답변

빅분기가자님의 프로필 이미지
빅분기가자

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(분류)

행일치 관련해서 개념이 헷갈립니다.

해결된 질문

작성

·

123

0

인강에서 배운코드는 위와 같고 간단하게 X_train[cols]와 y_train을 display하면 아래와 같이 나옵니다.제가 궁금한 것은 X_train과 y_train이 어쨌든 각 행별 id가 서로 1:1 매칭이되기 때문에 심플하게 submit = pd.DataFrame( { 'id':X_test['id'], 'income':pred } )이렇게 표기할 수 있는것같은데 만약에 X_train과 y_train이 서로 id별로 뒤죽박죽이면 둘다 id별로 sort_value를 하고 해야하는게 맞을까요? 그리고 시험문제에서는 이정도까지 처리를 요구할까요?  

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2회를 제외하고 X_train과 y_train이 합쳐 train으로 나오고 있기 때문에

뒤죽박죽으로 나오는 케이스는 나오지는 않을 것 같습니다.

아직 결측치도 나온적 없습니다.

빅분기가자님의 프로필 이미지
빅분기가자

작성한 질문수

질문하기