inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[임시 영상] 10회 작업형2 이야기

작업형 2유형 라벨인코더 사용시 점수 깎일까요?

153

인코더

작성한 질문수 1

1

안녕하세요!

10회 시험치고 난 후 복기하여 혹시 여기서 감점사항이 있을지 여쭤보고 싶습니다!!

 

제가 작성한 코드는 배운내용중 레이블 인코더를 작성한후 제출하였으며, rmse값은 500후반대가 나왔습니다!

(lightbgm으로 했을때 수치가 600대 이상으로 높게 나와서 최종적으론 randomforest로 제출)

 

코드는 아래와 같은데.. 고견 남겨주심 감사하겠습니다!!

(복기코드내용중 혹시 오타가 있다면 실제 시험에서는 없다고 가정) 

 

import pandas as pd

train = pd.read_csv("train.csv")

test = pd.read_csv("test.csv")

print("\n ===데이터크기===")

print("Train shape:", train.shape)

print("Test shape:", test.shape)

print( "\n ===데이터자료형===")

print(train.info())

print("\n ===결측치수===")

print(train.isnull().sum())

print(test.isnull().sum())

#train['GAS_TOTL'].nunique()

print("\n ===target기술통계===")

print(train['GAS_TOTL'].describe())

target = train.pop('GAS_TOTL')

from sklearn.preprocessing import LabelEncoder

cols = train.select_dtypes(include='object').columns

for col in cols:

le = LabelEncoder()

train[col] = le.fit_transform(train[col])

test[col] = le.transform(test[col])

from sklearn.model_selection import train_test_split

X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)

from sklearn.ensemble import RandomForestRegressor

rf = RandomForestRegressor(random_state=0)

rf.fit(X_tr, y_tr)

pred = rf.predict(X_val)

#import lightgbm as lgb

#lg = lgb.LGBMRegressor(random_state=0, verbose=-1)

#lg.fit(X_tr, y_tr)

#pred = lg.predict(X_val)

#print(mean_squared_error(y_val, pred)

from sklearn.metrics import mean_squared_error

rmse=mean_squared_error(y_val, pred)**0.5

print(rmse)

 

pred = rf.predict(test)

result = pd.DataFrame({'pred': pred})

result.to_csv("result.csv", index=False)

print(pred.shape)

print(pd.read_csv("result.csv").head())

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

1

퇴근후딴짓

작업형2 40점에 문제 없으셨죠??

1

인코더

네! 다행이도 40점 나왔습니다.

딴짓님 덕분에 점수 잘 받을 수 있었던것 같아요. 감사합니다!

1

퇴근후딴짓

9회까지 기준으로는 40점에 문제가 없습니다.

 

복기와 실제 코드가 다르지 않다면 이번에도 큰 문제 없을 것으로 예상해요!

고생 많으셨습니다 🙂 좋은 점수로 합격했길 기대해 볼게요!

작업형1 모의문제 4번에 3)문제 질문

0

14

2

이상치 전처리 작업

0

21

2

평가결과값 문의

0

24

2

시계열 데이터 날짜와 시간 format

0

31

2

평가지표 F1 스코어 질문드립니다.

0

24

2

작업형 2 기출7회분에서

0

36

2

작업형2 모의문제1 (30강)

0

34

2

수강 기간 연장 문의 드립니다.

0

41

2

수강 계획과 관련해 문의 드립니다.

0

27

2

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

50

2

작업형 1 -연습문제 4-6

0

38

2

작업형 1 유형 부분

0

42

2

작업형 1 (삭제예정, 구 버전)

0

51

2

수강기간 연장 문의드립니다.

0

38

2

2유형 레이블 인코딩 VS 원핫 인코딩

0

37

3

수강기간 연장 문의드립니다.

0

44

2

인덱스 슬라이싱

0

37

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

61

2

수강기간 연장 문의드립니다

0

48

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

64

2