inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

9회 기출유형(작업형3)

문제1-3 질문

40

gamb21

작성한 질문수 25

0

안녕하세요

앞서 ols을 만들때 data=train 즉 트래인에 있는 데이터로 학습을 한건데 테스트를 예측할때 data=test가 아닌 원래 train데이터로 학습된 모델을 그대로 사용하는이유가 뭘까요?

 

문제에서 1-2에서 적합한 회귀모형을 이용하라는 단서때문인가요? 아니면 원래 train 데이터로 학습된 모델을 사용해야해서 그런간가요

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

학습은 fit 이고

예측은 predit입니다

학습할때 data=train을 사용하고

만든 모델을 가지고 test를 예측합니다

 

data=test는 어디서 나온걸까요?

 

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. gamb21님.

질문해주신 내용과 관련하여 머신러닝에서 모델을 학습하고 예측하는 일반적인 흐름에 대해 설명드리겠습니다.

일반적으로 머신러닝이나 통계 모델을 구축할 때는 ‘train’ 데이터셋을 사용하여 모델을 학습합니다. ‘train’ 데이터셋은 모델이 어떤 형태의 데이터를 학습해야 하는지를 알려주는 역할을 합니다. 그 후, 학습된 모델을 검증하거나 최종적으로 ‘test’ 데이터를 예측하는 데 이 모델을 사용하게 됩니다.

질문에서 언급된 내용은 이러한 기초적인 방식에 기반한 것으로, 주어진 문제에서 ‘train’ 데이터로 모델을 학습한 후 ‘test’ 데이터로 예측하는 것이 일반적입니다. 문제에서 ‘적합한 회귀모형’을 사용하라는 것은 이미 학습된 모델을 활용하여 새로운 데이터에 대한 예측을 수행하란 의미죠.

이 기초적인 흐름을 잘 이해하고 계시다면 아래의 관련 질문들도 참고해 보세요:

  1. “작업형 2유형 질문” - 데이터셋 분리와 모델 학습에 관한 자세한 설명이 포함되어 있습니다.

  2. “1- 3 소문제 질문있습니다.” - train과 test 데이터의 활용 방안에 대한 유용한 질문과 답변이 있습니다.

이러한 자료들을 통해 훈련 데이터와 테스트 데이터의 역할을 명확히 이해하시고, 모델 예측 과정에 대해 더 깊은 이해를 가지실 수 있을 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

추가질문 합니다

0

7

1

시험환경 구름

0

9

1

2유형 질문드려요

0

7

1

RandomForest vs lgb

0

18

1

전처리 관련질문

0

12

2

작업형3 기출

0

12

1

유형2에서 데이터분할 생략 가능여부

0

20

2

9회 기출 유형3 질문

0

15

1

lgb 기초편

0

10

1

괄호 사용

0

15

1

작업형 2 데이터 전처리 질문

0

18

1

11회 기출 유형 작업형1 문제 3-1

0

14

0

예시문제 작업형2 (ver2023) 질문입니다

0

16

1

Data type에 따른 처리

0

15

2

데이터 전처리 관련

0

15

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

21

2

pd.get_dummies()가 bool로 반환

0

18

2

대응표본검정 레빈

0

23

3

단일표본검정 문제 유형

0

23

2

[작업형 3] 6~7. 카이제곱 검정

0

22

2

9회 작업형3 문제 1-1

0

37

2

최종답안 계산 방식 질문

0

25

1

시험 치기 전 급하게 질문 사항

0

41

2