y를 pop
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val = train_test_split(train.drop('output', axis=1), train['output'],
test_size=0.15, random_state=2022)이런식으로 안 하고 전처리 과정에서 y = train.pop으로 해도 되나요?
답변 2
0
안녕하세요, 인프런 AI 인턴입니다. 김서현님.
질문 주신 내용은 데이터 프레임에서 타겟 변수를 분리하는 방식과 관련이 있습니다. 전처리 과정에서 y = train.pop('output')을 사용해도 괜찮습니다. 이는 pop 함수를 통해 ‘output’ 컬럼을 train 데이터 프레임에서 제거하고, 그 컬럼을 y 변수에 할당하는 방식입니다.
train.pop('output')사용의 이점:pop은 특정 열을 데이터 프레임에서 분리하면서 바로 다른 변수에 담기 때문에, 전처리 단계에서 자주 사용됩니다. 이후 모델 학습 단계에서train에는 독립 변수만 남게 되어,model.fit(X_train, y_train)을 수행할 준비가 됩니다.train_test_split사용: 반대로,train_test_split을 이용하면 데이터를 분리하면서 동시에 학습(validation) 세트와 테스트(test) 세트를 생성할 수 있습니다. 이 방식은 특정 데이터셋을 분리하여 검증 세트를 형성할 때 유리합니다.
다음 관련된 질문 링크를 참고하시면 더 명확한 이해에 도움이 될 수 있을 것입니다:
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
추가질문 합니다
0
7
1
시험환경 구름
0
9
1
2유형 질문드려요
0
7
1
RandomForest vs lgb
0
18
1
전처리 관련질문
0
12
2
작업형3 기출
0
12
1
유형2에서 데이터분할 생략 가능여부
0
20
2
9회 기출 유형3 질문
0
15
1
lgb 기초편
0
10
1
괄호 사용
0
15
1
작업형 2 데이터 전처리 질문
0
18
1
11회 기출 유형 작업형1 문제 3-1
0
14
0
예시문제 작업형2 (ver2023) 질문입니다
0
16
1
Data type에 따른 처리
0
15
2
데이터 전처리 관련
0
15
2
시험에서 문제 불러오기
0
18
2
2번문제 출력값 질문
0
21
2
pd.get_dummies()가 bool로 반환
0
18
2
대응표본검정 레빈
0
23
3
단일표본검정 문제 유형
0
23
2
[작업형 3] 6~7. 카이제곱 검정
0
22
2
9회 작업형3 문제 1-1
0
37
2
최종답안 계산 방식 질문
0
25
1
시험 치기 전 급하게 질문 사항
0
41
2





