inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출 유형(작업형2)

이해가 가지 않는 것

해결된 질문

69

김라의

작성한 질문수 34

0

rf.fit(train,target)에 들어가는 값과 pred = rf.predict(test)에 들어가는 값이 train,target, test가 들어가는 이유가 있나요? 저기 들어가는 값의 기준이 궁금합니다.

# 모델 선택 및 학습
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=0)
rf.fit(train, target)
pred = rf.predict(test)
pred

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

fit은 데이터(타겟을 제외한 train데이터)와 정답(target)을 주면서 머신러닝을 학습(training) 합니다

predict는 학습된 모델을 가지고 예측합니다.

문제에서 test데이터의 예측값을 구하는 문제이므로 predict(test) 로 사용해요

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

김라의님께서 질문하신 내용에 대해 설명드리겠습니다.

모델 학습 시 사용하는 rf.fit(train, target) 과 예측 시 사용하는 pred = rf.predict(test) 에 들어가는 파라미터는 매우 중요한 역할을 합니다. 이 함수들은 머신러닝 모델의 학습과 예측을 위해 필요한 데이터를 지정합니다.

  1. rf.fit(train, target)에서 traintarget:

    • train: 학습용 데이터(features)입니다. 모델이 학습하기 위해 사용하는 독립 변수들의 집합입니다. 보통 2차원 배열(표 형식)의 형태로, 각 행은 하나의 샘플, 각 열은 하나의 특성(예: 나이, 성별 등)을 나타냅니다.
    • target: 타겟 데이터(labels)입니다. 모델이 학습할 때 각 샘플에 해당하는 정답 값을 나타냅니다. 예를 들어, 분류 문제의 경우 ‘스팸’, ‘스팸 아님’과 같은 카테고리 값을 가질 수 있습니다.
  2. rf.predict(test) 에서 test:

    • test: 예측을 하고자 하는 데이터(features)입니다. 학습에 사용했던 train 데이터와 같은 구조를 갖지만, 여기에는 타겟 데이터가 포함되어 있지 않으며, 모델이 이를 통해 결과를 예측합니다.

여기에서 중요한 점은 test 데이터 세트의 구조는 train 데이터와 동일해야 한다는 것입니다. 즉, 같은 특성의 수와 같은 종류 (예: 분석할 모든 특성의 스케일링 수준)로 구성되어야 모델이 올바르게 예측할 수 있습니다.

관련된 질문과 설명을 더 찾아보시려면 다음 링크를 참고해 주세요:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

뒤로가기 버튼 같은 것이 있나요?

0

28

1

강의 연장 문의

0

32

1

출력값 질문

0

31

2

수업노트가 어디에 있나요?

0

29

1

실기시험 제출관련

0

160

2

6.20 작업형 2 과적합

0

169

3

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

54

2

로지스틱회귀, 회귀

0

52

2

회귀 문제를 풀때 질문입니다.

0

59

1

불균형 처리 후 성능이 더 낮아졌다면,

0

66

2

실기 체험 제2유형 에러 문의

0

66

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

52

2

3번문제 등분산 가정

0

50

2

작업형3 target 형 변환 질문

0

38

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

40

3

원핫인코딩과 레이블 인코딩에서 concat

0

62

2

제2유형 질문입니다.

0

49

2

C()

0

44

2

작업형 2에서 strafity 적용 유무

0

53

2

수강 기간 연장 가능 여부 문의드립니다.

0

63

1

ols

0

44

2

2유형 작성관련 질문(일반 심화)

0

41

2

2유형 작성관련 질문

0

42

2

2유형 object컬럼 개수 다르면

0

49

2