작업형 2유형 라벨인코더 사용시 점수 깎일까요?
158
작성한 질문수 1
안녕하세요!
10회 시험치고 난 후 복기하여 혹시 여기서 감점사항이 있을지 여쭤보고 싶습니다!!
제가 작성한 코드는 배운내용중 레이블 인코더를 작성한후 제출하였으며, rmse값은 500후반대가 나왔습니다!
(lightbgm으로 했을때 수치가 600대 이상으로 높게 나와서 최종적으론 randomforest로 제출)
코드는 아래와 같은데.. 고견 남겨주심 감사하겠습니다!!
(복기코드내용중 혹시 오타가 있다면 실제 시험에서는 없다고 가정)
import pandas as pd
train = pd.read_csv("train.csv")
test = pd.read_csv("test.csv")
print("\n ===데이터크기===")
print("Train shape:", train.shape)
print("Test shape:", test.shape)
print( "\n ===데이터자료형===")
print(train.info())
print("\n ===결측치수===")
print(train.isnull().sum())
print(test.isnull().sum())
#train['GAS_TOTL'].nunique()
print("\n ===target기술통계===")
print(train['GAS_TOTL'].describe())
target = train.pop('GAS_TOTL')
from sklearn.preprocessing import LabelEncoder
cols = train.select_dtypes(include='object').columns
for col in cols:
le = LabelEncoder()
train[col] = le.fit_transform(train[col])
test[col] = le.transform(test[col])
from sklearn.model_selection import train_test_split
X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)
from sklearn.ensemble import RandomForestRegressor
rf = RandomForestRegressor(random_state=0)
rf.fit(X_tr, y_tr)
pred = rf.predict(X_val)
#import lightgbm as lgb
#lg = lgb.LGBMRegressor(random_state=0, verbose=-1)
#lg.fit(X_tr, y_tr)
#pred = lg.predict(X_val)
#print(mean_squared_error(y_val, pred)
from sklearn.metrics import mean_squared_error
rmse=mean_squared_error(y_val, pred)**0.5
print(rmse)
pred = rf.predict(test)
result = pd.DataFrame({'pred': pred})
result.to_csv("result.csv", index=False)
print(pred.shape)
print(pd.read_csv("result.csv").head())
답변 2
1
9회까지 기준으로는 40점에 문제가 없습니다.
복기와 실제 코드가 다르지 않다면 이번에도 큰 문제 없을 것으로 예상해요!
고생 많으셨습니다 🙂 좋은 점수로 합격했길 기대해 볼게요!
수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?
0
7
2
2유형 object 컬럼 인코딩 관련 질문
0
17
2
하이퍼파라미터 변수
0
15
2
52강 이원분산분석
0
16
2
실제시험환경에서 작업형1,2,3의 문제풀이 순서
0
19
2
독립표본검정
0
22
2
tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??
0
25
2
df.describe() 사용을 자제해야할까요?
0
27
2
shape 결과에 대한 문의
0
31
2
자료 문의
0
24
2
8 회귀 11번
0
23
2
심화 강의 관련 질문
0
29
2
빈도수 구하는 것 질문
0
19
2
커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?
0
33
1
작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의
0
30
2
수강연장가능문의
0
37
2
59. 11회 기출 유형 작업형 1 - 문제2 관련
0
31
2
원핫인코딩 슬라이싱 결과
0
26
2
random_state 값이 궁금합니다!
0
36
2
수강기간 연장 가능 여부 문의드립니다
0
55
2
city 컬럼 삭제
0
36
2
3회 기출(작업형 2) 질문 있습니다!!
0
38
1
2유형 탬플릿에 대한 질문입니다
0
51
1
시험환경 질문 드립니다.
0
40
1





