inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모의고사 2번 (5-2) 오류 질문

해결된 질문

158

미미밍

작성한 질문수 12

0

선생님 안녕하세요. 작업형2 모의고사 2번 관련하여 질문드립니다.

  1. train_test_split까지 잘 넘어온 다음에

    sklearn.ensemble 작성하려고 다시 코드 실행하니, 자꾸 같은 부분에서 해당 이미지처럼 에러가 나는데요. 선생님이 작성하신 답안 그대로 ctrl c / v 했는데도 같은 에러가 뜨는데, 어떤 것 때문일까요?

     

 

 

import pandas as pd
test = pd.read_csv("test.csv")
train = pd.read_csv("train.csv")
print(train.shape,test.shape)

#결측값 찾기
# train.isnull().sum() 'name', 'host_name', 'last_review','reviews_per_month'
#object값 확인
# train.info() -> object 6개

#2 EDA처리
# train.info() last_review 빼고 전부다 object형임


print(train.shape)
train = train.drop(cols, axis=1)
test = test.drop(cols, axis = 1)
print(train.shape)

#reviews_per_month는 결측값 채워주기
train['reviews_per_month'] = train['reviews_per_month'].fillna(0)
test['reviews_per_month'] = test['reviews_per_month'].fillna(0)
# 결측치 없음

#id제거
train = train.drop('id', axis =1)
test_id = test.pop('id')
test.head(2)

#라벨인코딩

cols = train.select_dtypes(include = 'object').columns
from sklearn.preprocessing import LabelEncoder

for col in cols:
    le = LabelEncoder()
    train[col] = le.fit_transform(train[col])
    test[col] = le.transform(test[col])

#train_test_split
from sklearn.model_selection import train_test_split
X_tr,X_val,y_tr,y_val = train_test_split(train.drop('price',axis=1), train['price'] , test_size = 0.3,random_state = 42)
## 전부 train에서 뽑는거임


# print(X_tr.shape,X_val.shape, y_tr.shape, y_val.shape)

from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor()
model.fit(X_tr,y_tr)
pred = model.predict(X_val)


test.head()
  1. 그리고 작업형2 회귀문제가 나온다면, 해당 이 부분은 외워야 하는 걸까요..? 필수적이면 닥암기하려고 합니다..

# 평가
import numpy as np
from sklearn.metrics import r2_score, mean_absolute_error, mean_squared_error
def rmse(y_test, y_pred): #RMSE
    return np.sqrt(mean_squared_error(y_test, y_pred))

def rmsle(y_test, y_pred): #RMSLE
    return np.sqrt(np.mean(np.power(np.log1p(y_test) - np.log1p(y_pred), 2)))

def mape(y_test, y_pred): #MAPE
    return np.mean(np.abs((y_test - y_pred) / y_test)) * 100

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

  1. cols 이 무엇인지 빠져있어요

     

print(train.shape) 
train = train.drop(cols, axis=1) 
test = test.drop(cols, axis = 1) 
print(train.shape)

제가 제공한 코드에는

cols = ['name', 'host_name', 'last_review', 'host_id'] 로 정의하고 있어요!

 

  1. rmse는 필수로 외워주세요!

다른 평가지표도 암기하면 좋지만 시험에서 생각나지 않는다면

회귀일 때 알고 있는 rmse로 검증하시죠!! 각 평가지표마다 차이는 있지만 오차를 줄이려고 하는 목표는 동일합니다.

작업형2 채점은 csv로만 진행해요!

1

미미밍

감사합니다 ㅠㅠ

코딩팡 장업형2 베이스 라인 인코딩 종류 질문

0

6

1

로지스틱회귀, 회귀

0

34

2

회귀 문제를 풀때 질문입니다.

0

34

1

불균형 처리 후 성능이 더 낮아졌다면,

0

47

2

실기 체험 제2유형 에러 문의

0

38

1

LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요

0

36

2

3번문제 등분산 가정

0

36

2

작업형3 target 형 변환 질문

0

30

2

[작업형1] 연습문제 섹션1 ~ 10 의 section4

0

23

3

원핫인코딩과 레이블 인코딩에서 concat

0

45

2

제2유형 질문입니다.

0

39

2

C()

0

36

2

작업형 2에서 strafity 적용 유무

0

45

2

수강 기간 연장 가능 여부 문의드립니다.

0

47

1

ols

0

37

2

2유형 작성관련 질문(일반 심화)

0

32

2

2유형 작성관련 질문

0

30

2

2유형 object컬럼 개수 다르면

0

37

2

코딩팡질문이요ㅠㅠ

0

37

2

관찰값과 기대값의 개념이 헷갈립니다.

0

19

2

작업형2 ID 컬럼 삭제 질문

0

40

2

2유형 작성관련 질문

0

27

2

memoryerror 질문

0

22

2

작업형 유형2 이렇게 고정 템플릿으로 가져가도 될까요?

0

37

1