강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

listensing님의 프로필 이미지
listensing

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

8회 기출유형(작업형2)

문제풀이 질문있습니다~

작성

·

40

0

몇가지 학습에 있어 궁금함이 생겨 질문드립니다.

 

1) 작업형 제1유형에서 사진과 같이 짤리는데 방법이 없을까요? 시험 환경도 동일 하더 라구요

작업형 제1유형.png.webp

2) 작업형 1유형에서 문제3을 푸는데

작업형1유형-3.png.webp

선생님이 푼거랑 다르게 풀어서 문제 답 내도 상관없나요?

3) 작업형 2유형에서 만약 MAE를 안돌리고 답안제출한다면 y_val은 필요가 없는건지 궁금합니다^^

답변 2

0

listensing님의 프로필 이미지
listensing
질문자

 네 만약 랜덤포레스트 1가지로 제출한다고 하면 굳이 검증 데이터를 분할 안 해도 되겠다 싶어서요 괜히 건드리다가 꼬이면 제출도 못 할 까봐.. 쌤이 예시문제 작업형 2(신유형) 첫번째 제출한 방식으로 하려고 합니다.

그러면은 인코딩까지 동일하게 하고

rf.fit(X_tr, y_tr)을

rf.fit(train, target)으로 바꾼다음

pred = rf.predict(X_val)을

pred = rf.predict(test)로 바꿔주면 되나요??

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네!! 맞아요 !

아직 한달이나 남았는데 😂

 

커리큘럼 아래쪽 팁에

작업형 2 한가지로 풀기 영상이 있습니다 💪💪

listensing님의 프로필 이미지
listensing
질문자

그러면은 평가하지 않고 제출할 때 랜덤포레스트 기준 요런식으로 작성하면 될까요.?

target = train.pop('농약검출여부')
train = pd.get_dummies(train)
test = pd.get_dummies(test)
train, test = train.align(test, axis=1, join='left', fill_value=0)
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=0)
rf.fit(train, target)
pred = rf.predict(test)
result = pd.DataFrame({'pred':pred})
result.to_csv('result.csv',index=False)

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

짤린다는게 어떤 의미 일까요? 가운데 생략된 부분일까요?

생략은 아래와 같은 처리로 가능은합니다만 행을 다 본다는 것은 어렵습니다. 수천개가 나올 수도 있어요

# 모든 열 출력
pd.set_option('display.max_columns', None)

# 모든 행 출력
pd.set_option('display.max_rows', None)

 

  1. 네 풀이과정은 달라도 됩니다 🙂

  2. 네 평가지표로 점수를 확인하지 않는다면 검증데이터를 나눈 의미가 없어요. 그 럴경우 나누지 않고 전체 데이터를 학습용으로 사용하는 것이 더 좋습니다. 평가 하지 않으실려구요??

     

 

listensing님의 프로필 이미지
listensing

작성한 질문수

질문하기