inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(회귀)

3-6 검증데이터 분리에서 갑분y.. 뭘까요?

해결된 질문

103

zizizi207

작성한 질문수 3

0

안녕하세요

3-6 회귀- 검정데이터 분리에

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val = train_test_split(train.drop('charges'), axis=1),하고

y값으로 chages를 넣어주면 된다고 하셨는데 이 부분이 이해가 안가요.

train, test하다가 갑자기 y값이 나온 것과

train.drop('charges')에서 charges를 제외하는데 y값에 charges를 넣는게 이해안됩니다...

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

갑분...

갑자기 분위기가 어려워졌나요? 🥲

X_tr, X_val, y_tr, y_val로 나눌 때 y는 target을 의미합니다.

X에는 target을 제외한 변수가 들어가고요!

train_test_split(X 데이터, y데이터)

 

그리고 지금 시험이 며칠 남지 않아 9회를 준비하는 것이 맞다면

작업형2는

꿀팀 섹션 작업형2 한가지 방법으로 풀기 이부분 학습 먼저 부탁드립니다.

 

 

 

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다.

zizizi207님이 질문하신 부분은 머신러닝의 train_test_split 함수 사용에서 타겟 변수와 피처(feature)를 분리하는 부분에서 혼란이 생기신 것 같습니다.

핵심 개념 설명:

  1. 타겟 변수와 피처의 분리:

    • 머신러닝 모델을 학습하려면 데이터를 타겟 변수(예측할 값)와 피처(설명변수)로 나누어야 합니다. 여기서 charges는 예측하길 원하는 타겟 값이기 때문에 모델 학습 시 타겟 변수로 지정됩니다.
  2. 코드 설명:

    • train.drop('charges', axis=1)은 데이터셋에서 charges 컬럼을 제거한 피처들만 반환합니다. 이 피처들은 X_trX_val로 나뉘어 모델 학습 시 독립변수로 사용됩니다.
    • train['charges']는 타겟 변수로, y_try_val이 됩니다. 이는 모델이 예측하려고 학습하는 데이터입니다.

이제 각각의 부분이 독립된 변수와 종속된 변수를 어떻게 나누는지를 이해하시길 바랍니다.

아래 링크는 이전 강의에서 유사한 내용을 다룬 질문과 답변입니다. 이 내용을 참고하면 더 명확한 이해에 도움 될 것입니다.

  • 데이터 분리할때에서 비슷한 질문이 있었으며, train.drop('TravelInsurance', axis=1)을 사용해 타겟 변수와 피처를 어떻게 분리하는지에 대해 설명하고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.

현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏

추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형 1 유형 부분

0

9

1

작업형 1 (삭제예정, 구 버전)

0

28

2

수강기간 연장 문의드립니다.

0

21

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

22

3

수강기간 연장 문의드립니다.

0

26

1

인덱스 슬라이싱

0

27

2

질문 드립니다.

0

45

2

강의 내용 관련 질문드립니다~

0

43

2

수강 연장 문의

0

54

2

강의자료 일괄 다운로드

0

50

2

수강기간 연장 문의드립니다

0

40

2

list 문제 질문드립니다~

0

34

2

빅분기 실기 12회 재도전

0

53

2

강의 기간 연장 가능여부 검토 요청건

0

39

2

수강기간 연장 문의 드립니다

0

43

2

수강기간 연장 문의드립니다

0

50

2

질문이요

0

56

2

수강기간 연장 문의드립니다.

0

58

2

문제 3-2 질문드립니다

0

47

2

수강기간 연장 문의 드립니다.

0

61

2

변수, 칼럼 , df 구분

0

51

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

49

2

수강기간 연장 문의드립니다.

0

42

2