inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(회귀)

3-6 검증데이터 분리에서 갑분y.. 뭘까요?

해결된 질문

107

zizizi207

작성한 질문수 3

0

안녕하세요

3-6 회귀- 검정데이터 분리에

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val = train_test_split(train.drop('charges'), axis=1),하고

y값으로 chages를 넣어주면 된다고 하셨는데 이 부분이 이해가 안가요.

train, test하다가 갑자기 y값이 나온 것과

train.drop('charges')에서 charges를 제외하는데 y값에 charges를 넣는게 이해안됩니다...

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

갑분...

갑자기 분위기가 어려워졌나요? 🥲

X_tr, X_val, y_tr, y_val로 나눌 때 y는 target을 의미합니다.

X에는 target을 제외한 변수가 들어가고요!

train_test_split(X 데이터, y데이터)

 

그리고 지금 시험이 며칠 남지 않아 9회를 준비하는 것이 맞다면

작업형2는

꿀팀 섹션 작업형2 한가지 방법으로 풀기 이부분 학습 먼저 부탁드립니다.

 

 

 

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

zizizi207님이 질문하신 부분은 머신러닝의 train_test_split 함수 사용에서 타겟 변수와 피처(feature)를 분리하는 부분에서 혼란이 생기신 것 같습니다.

핵심 개념 설명:

  1. 타겟 변수와 피처의 분리:

    • 머신러닝 모델을 학습하려면 데이터를 타겟 변수(예측할 값)와 피처(설명변수)로 나누어야 합니다. 여기서 charges는 예측하길 원하는 타겟 값이기 때문에 모델 학습 시 타겟 변수로 지정됩니다.
  2. 코드 설명:

    • train.drop('charges', axis=1)은 데이터셋에서 charges 컬럼을 제거한 피처들만 반환합니다. 이 피처들은 X_trX_val로 나뉘어 모델 학습 시 독립변수로 사용됩니다.
    • train['charges']는 타겟 변수로, y_try_val이 됩니다. 이는 모델이 예측하려고 학습하는 데이터입니다.

이제 각각의 부분이 독립된 변수와 종속된 변수를 어떻게 나누는지를 이해하시길 바랍니다.

아래 링크는 이전 강의에서 유사한 내용을 다룬 질문과 답변입니다. 이 내용을 참고하면 더 명확한 이해에 도움 될 것입니다.

  • 데이터 분리할때에서 비슷한 질문이 있었으며, train.drop('TravelInsurance', axis=1)을 사용해 타겟 변수와 피처를 어떻게 분리하는지에 대해 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.

현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏

추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형2 카테고리

0

9

1

110강 회귀_8번 문의

0

9

2

XGBRegressor 학습 시 warning 출력

0

13

2

데이터 프레임을 변경해도 되나요?

0

10

2

10회 기출 작업형3 문제 2-1 질문

0

16

2

작업형 2 질문

0

16

2

작업형 2 템플릿 확인 요청

0

14

2

작업형2 인코딩 질문

0

22

2

작업형 3 벼락치기 공부방법 질문

0

31

2

기출 11회 작업형 2_전체 데이터 학습 여부

0

32

2

예측값 결과 소수점 차이

0

28

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

36

1

전처리 train() test([ ])

0

23

2

작업형 1 배경지식 질문

0

33

2

옳게 풀은건지 질문드립니다!

0

22

1

roc_auc_score

0

30

2

추가질문 합니다

0

22

2

시험환경 구름

0

21

2

2유형 질문드려요

0

21

2

RandomForest vs lgb

0

30

2

전처리 관련질문

0

29

3

작업형3 기출

0

22

2

유형2에서 데이터분할 생략 가능여부

0

33

2

9회 기출 유형3 질문

0

23

2