이해가 가지 않는 것
rf.fit(train,target)에 들어가는 값과 pred = rf.predict(test)에 들어가는 값이 train,target, test가 들어가는 이유가 있나요? 저기 들어가는 값의 기준이 궁금합니다.
# 모델 선택 및 학습
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=0)
rf.fit(train, target)
pred = rf.predict(test)
pred
답변 2
0
fit은 데이터(타겟을 제외한 train데이터)와 정답(target)을 주면서 머신러닝을 학습(training) 합니다
predict는 학습된 모델을 가지고 예측합니다.
문제에서 test데이터의 예측값을 구하는 문제이므로 predict(test) 로 사용해요
0
안녕하세요, 인프런 AI 인턴입니다.
김라의님께서 질문하신 내용에 대해 설명드리겠습니다.
모델 학습 시 사용하는 rf.fit(train, target) 과 예측 시 사용하는 pred = rf.predict(test) 에 들어가는 파라미터는 매우 중요한 역할을 합니다. 이 함수들은 머신러닝 모델의 학습과 예측을 위해 필요한 데이터를 지정합니다.
rf.fit(train, target)에서train과target:train: 학습용 데이터(features)입니다. 모델이 학습하기 위해 사용하는 독립 변수들의 집합입니다. 보통 2차원 배열(표 형식)의 형태로, 각 행은 하나의 샘플, 각 열은 하나의 특성(예: 나이, 성별 등)을 나타냅니다.
target: 타겟 데이터(labels)입니다. 모델이 학습할 때 각 샘플에 해당하는 정답 값을 나타냅니다. 예를 들어, 분류 문제의 경우 ‘스팸’, ‘스팸 아님’과 같은 카테고리 값을 가질 수 있습니다.
rf.predict(test)에서test:test: 예측을 하고자 하는 데이터(features)입니다. 학습에 사용했던train데이터와 같은 구조를 갖지만, 여기에는 타겟 데이터가 포함되어 있지 않으며, 모델이 이를 통해 결과를 예측합니다.
여기에서 중요한 점은 test 데이터 세트의 구조는 train 데이터와 동일해야 한다는 것입니다. 즉, 같은 특성의 수와 같은 종류 (예: 분석할 모든 특성의 스케일링 수준)로 구성되어야 모델이 올바르게 예측할 수 있습니다.
관련된 질문과 설명을 더 찾아보시려면 다음 링크를 참고해 주세요:
- 랜덤포레스트 돌리는 과정에서 질문있습니다: 여기서는 모델 학습과 예측에 사용되는 데이터의 관계에 대해 설명합니다.
- RandomForest ‘Classifier’, ‘Regressor’ 차이: RandomForest 모델을 사용할 때, 데이터 타입에 따라 분류용과 회귀용의 차이에 대해 설명합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
뒤로가기 버튼 같은 것이 있나요?
0
28
1
강의 연장 문의
0
32
1
출력값 질문
0
31
2
수업노트가 어디에 있나요?
0
29
1
실기시험 제출관련
0
160
2
6.20 작업형 2 과적합
0
169
3
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
0
54
2
로지스틱회귀, 회귀
0
52
2
회귀 문제를 풀때 질문입니다.
0
59
1
불균형 처리 후 성능이 더 낮아졌다면,
0
66
2
실기 체험 제2유형 에러 문의
0
66
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
52
2
3번문제 등분산 가정
0
50
2
작업형3 target 형 변환 질문
0
38
2
[작업형1] 연습문제 섹션1 ~ 10 의 section4
0
40
3
원핫인코딩과 레이블 인코딩에서 concat
0
62
2
제2유형 질문입니다.
0
49
2
C()
0
44
2
작업형 2에서 strafity 적용 유무
0
53
2
수강 기간 연장 가능 여부 문의드립니다.
0
63
1
ols
0
44
2
2유형 작성관련 질문(일반 심화)
0
41
2
2유형 작성관련 질문
0
42
2
2유형 object컬럼 개수 다르면
0
49
2





