inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

5회 기출유형 (작업형2)

y_train

101

shs4166

작성한 질문수 50

0

y_train = train.pop("price")를 하는 이유가 궁금합니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 3

0

wjdg0111

y_train = train.pop("price")를

 

target = train.pop('price')로 작성해도되나요?

0

퇴근후딴짓

test에는 price가 없어요!

이에 train과 test컬럼을 맞추기 위해 price를 y_train 변수에 옮겼습니다.

아래 2가지 작업을 수행합니다.

  1. y_train에 옮긴다.

  2. train에서는 드랍한다.

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. shs4166님.

y_train = train.pop("price") 이 구문은 머신러닝 모델에서 독립 변수(features)와 종속 변수(target)를 분리하는 과정입니다. 여기서 y_train은 지도 학습(supervised learning)에서 모델이 학습할 실제 값(target value)을 의미합니다.

  • pop 함수의 역할: pop은 데이터를 다른 변수로 이동시키면서 원래 데이터프레임에서는 그 열(column)을 제거합니다. 예를 들어, “price”라는 열은 예측해야 할 값이므로 독립 변수(features)인 X_train에서는 제외되어야 하기에 pop을 사용하여 제거하고, 해당 열을 y_train에 저장합니다.

  • 이 과정의 중요성: 머신러닝 모델은 예측할 값을 제외한 모든 열의 데이터를 사용해 학습합니다. 따라서, 대상 컬럼(price)을 제외하여 학습 데이터와 레이블 데이터(정답)로 분리해야 합니다.

관련된 기존 질문을 참고하시어 더 깊이 있는 설명을 통해 이해를 도울 수 있도록 다음 질문 역시 확인해 보시면 좋을 듯합니다:
- y_train은 왜 필요한거예요?

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

옳게 풀은건지 질문드립니다!

0

2

0

roc_auc_score

0

4

1

추가질문 합니다

0

11

1

시험환경 구름

0

11

1

2유형 질문드려요

0

8

1

RandomForest vs lgb

0

18

1

전처리 관련질문

0

13

2

작업형3 기출

0

13

1

유형2에서 데이터분할 생략 가능여부

0

20

2

9회 기출 유형3 질문

0

15

1

lgb 기초편

0

10

1

괄호 사용

0

15

1

작업형 2 데이터 전처리 질문

0

18

1

11회 기출 유형 작업형1 문제 3-1

0

16

0

예시문제 작업형2 (ver2023) 질문입니다

0

16

1

Data type에 따른 처리

0

15

2

데이터 전처리 관련

0

16

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

23

2

pd.get_dummies()가 bool로 반환

0

18

2

대응표본검정 레빈

0

23

3

단일표본검정 문제 유형

0

23

2

[작업형 3] 6~7. 카이제곱 검정

0

23

2

9회 작업형3 문제 1-1

0

37

2