RandomForestRegressor 실행할때 마다 성능평가값이 달라집니다.
RandomForestRegressor 실행할때 마다 성능평가값이 달라집니다.
반복해서 실행하니, 처음보다 유의미하게 수치가 낮아졋습니다.
강의에서는 스케일링 한거 보다 베이스라인이 성능평가가 더 낫다고 하는데, minmaxsclaler 를bmi 만 한 성능평가 수치가 가장 좋습니다.
질문1) 랜덤포레스트는 원래 돌릴때마다 성능이 좋아지나요?
질문2) 시험환경에서는 랜덤포레스트를 반복해서 실행하면 안되나요? (성능평가 결과가 좋아져서 신뢰성 하락이 되나요?
답변 2
0
돌릴 때 마다 성능이 좋아지는 것은 아니고
ramdom_state를 설정하지 않으면 돌릴 때 마다 결과가 달라집니다.
반복해서 성능이 좋아진건 우연일 것 같아요.
ramdom_state = 0 으로 고정해 주세요. 0 외 다른 정수를 사용해도 됩니다.
RandomForestRegressor(random_state=0)
이렇게 사용하면 실행시 동일한 결과값을 구할 수 있어요.
반복해서 실행하는 것은 아무런 영향이 없습니다. 최종 제출하면 제출된 코드에서 생성된 csv로 평가 합니다. 반복실행해도 되고, 여러번 제출해도 됩니다.
0
안녕하세요, 인프런 AI 인턴입니다. jcol13님 질문에 대해 답변드리겠습니다.
질문 1: 랜덤포레스트는 원래 돌릴 때마다 성능이 좋아지나요?
랜덤포레스트와 같은 일부 머신러닝 모델은 내부적으로 무작위성을 사용하기 때문에 매번 실행할 때마다 결과가 다르게 나타날 수 있습니다. 특정 상황에서 이전보다 성능이 좋아질 수 있지만, 이것이 항상 그런 것은 아닙니다. 모델의 일관성을 보장하려면 random_state 파라미터를 설정하여 결과를 고정시키는 것이 좋습니다. 이렇게 하면 학습 결과가 실행할 때마다 동일하게 유지될 수 있습니다.
질문 2: 시험 환경에서는 랜덤포레스트를 반복해서 실행하면 안 되나요?
시험 환경에서는 하나의 일관된 결과를 기반으로 평가를 진행하는 것이 일반적입니다. 그러므로 무작위성 때문에 성능이 변할 수 있는 상황을 방지하기 위해, random_state를 설정하여 같은 조건에서 테스트를 수행하는 것이 바람직합니다. 이는 결과의 신뢰성을 높입니다.
유사한 사례를 다룬 답변을 참고하시면 도움 될 수 있습니다:
이 두 링크에서는 랜덤포레스트와 관련된 성능 차이와 재현성을 확보하는 방법에 대해 설명합니다. 강의 내용을 학습하며 설정을 조정하면 더욱 일관된 결과를 얻을 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
작업형 1 유형 부분
0
9
1
작업형 1 (삭제예정, 구 버전)
0
28
2
수강기간 연장 문의드립니다.
0
21
1
2유형 레이블 인코딩 VS 원핫 인코딩
0
23
3
수강기간 연장 문의드립니다.
0
26
1
인덱스 슬라이싱
0
27
2
질문 드립니다.
0
45
2
강의 내용 관련 질문드립니다~
0
43
2
수강 연장 문의
0
54
2
강의자료 일괄 다운로드
0
50
2
수강기간 연장 문의드립니다
0
40
2
list 문제 질문드립니다~
0
35
2
빅분기 실기 12회 재도전
0
53
2
강의 기간 연장 가능여부 검토 요청건
0
39
2
수강기간 연장 문의 드립니다
0
43
2
수강기간 연장 문의드립니다
0
50
2
질문이요
0
56
2
수강기간 연장 문의드립니다.
0
58
2
문제 3-2 질문드립니다
0
47
2
수강기간 연장 문의 드립니다.
0
61
2
변수, 칼럼 , df 구분
0
51
2
수강기간 연장 문의드립니다.
0
50
2
수강기간 연장 문의
0
49
2
수강기간 연장 문의드립니다.
0
42
2





