모델링 및 평가(분류) 강의에서
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요
아래 보시면 학습용 데이터와 검증용 데이터로 구분하는 것은 이해가 되는데, y부터 마지막까지의 식이 왜 나오는지 이해가 안됩니다...다시 설명 부탁드립니다.
# 학습용 데이터와 검증용 데이터로 구분
from sklearn.model_selection import train_test_split
y = (y_train['income'] == '>50K').astype(int)
X_tr, X_val, y_tr, y_val = train_test_split(X_train, y, test_size=0.1, random_state=2000)
답변 1
1
문자를 0과 1로 변환하기 위해 사용했어요!
y는
'income'이 '>50K'인 경우 1,
그렇지 않은 경우 0인 이진(target) 변수로 변환하기 위해 작성한 코드에요
그럼 무조건 문자일때 변경해야 하느냐?
아니요!
모델 학습까지는 변환하지 않더라도 정상 작동 됩니다.
선택의 문제인데
일부 평가지표에서 추가적인 설정이 필요할 때가 있어 0과 1로 변환했습니다. (타겟이 문자일 때 평가지표 강의 영상 확인 요청)
어떤 의미냐?
1 조건: y_train['income'] == '>50K' -> True 또는 False가 나옴
2 자료형 변경: .astype(int) -> 논리 연산의 결과(True/False)를 정수형(int)으로 변환 True 1, False0
기출에서 사용된적 있냐?
없습니다. 어렵다면 일단은 패스하고 넘어가주세요!
난이도가 올라갔을 때를 가정했습니다.
1유형 강의 다 나간 후 어떻게 할까요?
0
13
1
점수차가 많이 나는데 따로 하신게 있으신가요?
0
10
1
작업형1 모의문제 4번에 3)문제 질문
0
21
2
이상치 전처리 작업
0
25
2
평가결과값 문의
0
29
2
시계열 데이터 날짜와 시간 format
0
34
2
평가지표 F1 스코어 질문드립니다.
0
27
2
작업형 2 기출7회분에서
0
38
2
작업형2 모의문제1 (30강)
0
34
2
수강 기간 연장 문의 드립니다.
0
42
2
수강 계획과 관련해 문의 드립니다.
0
30
2
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
0
50
2
작업형 1 -연습문제 4-6
0
38
2
작업형 1 유형 부분
0
42
2
작업형 1 (삭제예정, 구 버전)
0
51
2
수강기간 연장 문의드립니다.
0
38
2
2유형 레이블 인코딩 VS 원핫 인코딩
0
37
3
수강기간 연장 문의드립니다.
0
44
2
인덱스 슬라이싱
0
37
2
질문 드립니다.
0
50
2
강의 내용 관련 질문드립니다~
0
46
2
수강 연장 문의
0
63
2
강의자료 일괄 다운로드
0
62
2
수강기간 연장 문의드립니다
0
48
2





