섹션4. 이직 여부 예측 질문
41
99ethan
작성한 질문수 7
0
코딩이 실행이 안되는 이유가 궁금합니다.
import pandas as pd
train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/hr_train.csv")
test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/hr_test.csv")
target=train.pop('target')
train=train.fillna('X')
test=test.fillna('X')
df=pd.concat([train,test],axis=0)
df=pd.get_dummies(df)
train=train.iloc[:len(train)].copy()
test=test.iloc[len(train):].copy()
from sklearn.model_selection import train_test_split
X_tr,X_val,y_tr,y_val=train_test_split(train,target,test_size=0.2,random_state=0)
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=0)
rf.fit(X_tr, y_tr)
pred = rf.predict_proba(X_val)
pred = rf.predict_proba(test)
답변 1
0
데이터를 분리하고 합치고 할 때 사이즈는 문제가 없는지
점검하면서 코딩해주세요!
모두 입력하고나서 에러가 나면 입문자는 생각보니 찾는 것이 쉽지 않거든요
데이터를 df로 합칠 쳤는데
다시 나눌때는 df를 사용하는 것이 아니라 train으로 test로 나누는 이상한 코드가 되어있습니다.
train=df.iloc[:len(train)].copy()
test=df.iloc[len(train):].copy()
대응표본검정 레빈
0
13
2
단일표본검정 문제 유형
0
16
2
[작업형 3] 6~7. 카이제곱 검정
0
15
2
9회 작업형3 문제 1-1
0
19
2
최종답안 계산 방식 질문
0
14
1
시험 치기 전 급하게 질문 사항
0
24
2
유형3
0
23
2
작업형 2 연습문제 섹션 3
0
17
2
11 기출문제 ipynb파일
0
21
2
작업형 3 유형
0
21
2
11회 기출 유형(작업형1) 2번 정답
0
18
2
f1 score 질문
0
19
2
10회 작업형 2 인코딩 질의
0
16
2
53번 강의에서 갑자기 수업노트가 없어졌습니다.
0
21
2
28:19 roc_auc이유
0
20
2
수강연장문의
0
23
2
전체적인 머신러닝 순서
0
24
2
빅분기 실기 유형2질문
0
26
1
ID 전처리 이유
0
31
2
데이터제공
0
33
2
예시문제 작업형3 꼬리질문2번
0
22
1
데이터 개수를 구할 때, len과 value_counts 차이
0
28
2
작업형 2 제출방
0
22
2
인코딩 스케일링 순서
0
24
2





