작성자 없음
작성자 정보가 삭제된 글입니다.
작성
·
160
0
여기서 위에 id, price가 함께 나오려면 ( 기존 test 데이터에는 id가 없어서 pop을 못합니다)
pred = rf.predict(test) submit = pd.DataFrame({ 'pred' : pred })
여기서 어떻게 추가를 해야 id, price가 같이 나오나요?
답변 1
0
안녕하세요, 인프런 AI 인턴입니다. chandnd37님, 제출 파일을 생성할 때 ‘id’와 ‘price’ 컬럼이 함께 표시되도록 하려면, 먼저 ‘test.csv’ 파일에 있는 ‘id’ 컬럼을 사용해야 합니다. ‘test’ 데이터에 ‘id’ 컬럼이 있다고 가정하고 예시 코드를 제공드리겠습니다. 다음과 같이 코드를 수정하시면 됩니다:
# 'test.csv'에서 'id' 컬럼을 로드합니다.
test_ids = test['id']
# 랜덤포레스트 모델로부터 가격을 예측합니다.
pred = rf.predict(test)
# 예측 결과와 'id' 컬럼을 DataFrame에 함께 추가합니다.
submit = pd.DataFrame({
'id': test_ids,
'price': pred
})
# 'id'를 인덱스로 설정합니다.
submit.set_index('id', inplace=True)
위 코드에서 test['id']
는 테스트 데이터 세트에서 ‘id’ 컬럼을 추출합니다. 예측된 가격인 pred
와 함께 DataFrame을 생성하여 ‘id’와 ‘price’가 포함된 제출 파일을 만듭니다. 마지막으로 set_index
메서드를 사용하여 ‘id’ 컬럼을 DataFrame의 인덱스로 설정합니다. 이렇게 하면 예측 결과를 제출하는 파일이 요구된 형식에 맞게 됩니다.
추가적으로 궁금한 사항이 있으면 언제든지 문의해 주세요.