강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

wlysh999님의 프로필 이미지
wlysh999

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

제2회 기출, 제2유형

작성

·

58

0

안녕하세요.

제2회 기출, 제2유형 아래와같이 풀어봤는데 확인 부탁드립니다.

  1. 랜포활용

  2. 검증안함

 

검증은 어차피 시험에 반영안되고,

랜포밖에 할 줄 몰라서 이것만 암기했어요.

 

도저히 다른거 풀 자신이 없어서

시험 제2유형의 모든문제는 아래 패턴으로 진행하려합니다.

 

혹시 이렇게 진행해도되는지 문의드립니다.

 

# 데이터 불러오기
import pandas as pd
test = pd.read_csv("X_test.csv")
train = pd.read_csv("X_train.csv")
y_train = pd.read_csv("y_train.csv")

X_train.shape, y_train.shape, X_test.shape

# train.info()
# test.info()
# y_train.info()

target = y_train.pop('Reached.on.Time_Y.N')

train = pd.get_dummies(train)
test = pd.get_dummies(test)
train, test = train.align(test, join='left', axis = 1)

from sklearn.model_selection import train_test_split
x_tr, x_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)

from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state = 0)
rf.fit(x_tr, y_tr)
pred = rf.predict_proba(test)
test_ID = test.pop('ID')


submit = pd.DataFrame({'ID' : test_ID, 'Reached.on.Time_Y.N' : pred[:,1]})
submit.to_csv('result.csv', index=False)

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

모든 문제에 적용하는 것이라면

현재 기준, 섹션 20 - 기출(작업형2) 한 가지 방법으로 풀기

영상으로 추천드립니다.

 

위 방식은 저도 모든 시험환경을 테스트 해본 것이 아니라 장담할 수가 없을 것 같습니다.
특히 train, test = train.align(test, join='left', axis = 1) 이 새로운 방법이네요! 👍

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

지금은 조금 어렵지만, 시간 날 때 이 방식으로 직접 테스트해 보겠습니다.
이론적으로는 train 쪽 기준으로 맞출지, test 쪽 기준으로 맞출지만 정하면 되는 거네요.

wlysh999님의 프로필 이미지
wlysh999

작성한 질문수

질문하기