질문 & 답변 - 인프런 | 커뮤니티

묻고 답해요

169만명의 커뮤니티!! 함께 토론해봐요.

인프런 TOP Writers

해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

분산분석 관련 질문

분산분석에서 일원이던, 이원 분산분석이던, 무조건 독립변수에 C()로 감싸줘야 하나요?지금까지 3유형에서 ANOVA(분산분석) 관련 문제가 나온적이 있는지 궁금합니다~!

ryj0330 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

57

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

원핫인코딩, 레이블인코딩 사용

원핫인코딩, 레이블인코딩 사용방법에 관한 질문입니다.둘 중 아무거나 사용해도 상관은 없는데 어떤 수가 작으면 유니크 수가 작으면 원핫인코딩으로 하는 게 수월하다라는 내용을 이전 강의 때 들은 것 같습니다.제가 잘 기억하고 있는지는 모르겠지만.. 06:00 한가지 컬럼에서(ID)만 수가 크게 나올 시에는 레이블인코딩을 사용하는 것이 맞을까요?레이블인코딩과 원핫인코딩 중 하나만 기억날 시 기억나는 거라도 작성해서 제출해도 될까요?

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

80

답변

3
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

Claassifier, Regressor 사용

랜덤포레스트를 외울 때 Classifier로만 외우다보니 오류가 나서 재확인을 해봤습니다.Regressor도 붙여서 사용하더라고요.제가 한가지만 외워서 오류가 났던 걸 확인했습니다.질문드릴 점은 언제 어떤걸 쓰는지가 구분이 안됩니다...

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

51

답변

2
미해결
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2유형 코드 암기 확인 부탁드립니다!!

안녕하세요 강사님 ^^다름이아니라 시험 전 2유형 코드 여쭤보려고 질문 남깁니다!2유형 이렇게만 하면 될까요? 중간에 검증과 평가를 제외해서,, 확인 한번만 부탁드립니다! target = train.pop('타켓명')train = pd.get_dummies(train)test = pd.get_dummies(test)test = test.reindex(columns=train.columns, fill_value=0) #train과 test 컬럼명이 다르다면 수행 from sklearn.ensemble import RandomForestClassifier/Regressorrf = RandomForestClassifier/Regressor(random_state =0)rf.fit(train, target) pred = rf.predict(test)submit = pd.DataFrame({'pred':pred})submit.to_csv("result.csv', index=False)print(pd.read_csv("result.csv").head()) #제출파일확인print(pd.read_csv("result.csv").shape) #제출파일확인

권재경 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

70

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 3회 기출 1번 질문

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 문제 1번의 경우 결측치 행을 제거하면 행이 51개가 나오는데 앞에서부터 70퍼면 35.7 이라는 숫자가 나옵니다. 문제에서 반올림 할건지 버림으로 정수형으로 나타내는지 언급이 없어서 두 방법을 사용할때의 답이 다른데혹시 복수정답의 여지는 없나요? 문제에서 표현이 명확하지 않은 것 같습니다. 아니면 이렇게 모호할때는 버림으로 정수형 나타내는게 정배인가요? 감사합니다

gamb21 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

37

답변

1
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

오류율 pop 질문입니다.

오류율을 구할때 target을 pop하지 않아도 되는건가요?이전 강의에선 pop을 했던것같은데, 연습문제 9.로지스틱 회귀 8번 정확도에서 pop하지 않는데 상관없나요?target = test.pop('gender') pred = model.predict(test) > 0.5accuracy = accuracy_score(target, pred) print(1-accuracy)# 8. 정확도 pred = model.predict(b) pred = (pred > 0.5).astype(int) from sklearn.metrics import accuracy_score accuracy = accuracy_score(b['target'], pred) print("8.", accuracy)

최유정 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

47

답변

2
미해결
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[기출 10회] 작업형2 target변수 결측치 처리

안녕하세요. 기출 10회를 다시 풀어보고 있는데, 작업형 2에서 타겟 변수에 0이 있는 경우를 처리를 하는지 안하는지에 따라 rmse 값이 차이가 꽤 크더라구요. 이렇게 차이가 꽤 있는데도 결측치를 처리한 경우와 안한 경우 둘다 만점을 받을 수 있던 문제였나요? #타겟변수에서 결측치를 제거한 경우의 rmse rf_rmse = 673.8026644431536 #타겟변수에서 결측치를 제거하지 않은 경우의 rmse rf_rmse = 960.485846380754

민지 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

39

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

코드 한번 봐주실 수 있나요?

김서현 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

46

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

분포

08:51타겟 시각화는 어차피 지원 안한다고 하였고..분포도 꼭 외워야 할까요 ㅠ

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

26

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

회귀나 분류 둘 다 예측을 랜덤이랑 lgb로만 평가해도 되너요?(선형이나,xgb말고요)!

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요

김서현 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

64

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

pvalue 5.8686553916715e-06) 이렇게 적어도 되나요?

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요굳이 포맷 써서 안바꾸고 아래처럼만 제출해도 상관없나요?5.8686553916715e-06)

봉동개미 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

56

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

강의 자료 위치

안녕하세요 급하게 강의를 시작하게 되어서 몇개씩만 빠르게 수강중입니다. 죄송하지만 빠르게 수강중이라 놓친 내용들이 많아서 질문드립니다. 혹시 강의에서 나온 내용들이 정리되어 있는 사이트나 직접 연습을 해볼 수 있는 사이트가 있을까요? 강의 처음에 read_csv() 를 불러올때 파일 등이 있는 위치가 궁금합니다.

logan825 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

59

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

pred[:,1]가 쓰이는 위치 관련 질문

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요roc_auc_score 가 평가지표로 지정된 분류문제에서 rf.fit(X_tr, y_tr)로 학습하고pred= rf.predict_proba(X_val) 로 pred를 만든 후from sklearn.metrics import roc_auc_scoreroc_auc_score(y_val, pred[:,1]) << 이 부분과pred=rf.predict_proba(test)result= pd.DataFrame({'pred': pred[:,1]}) << 이 부분 이렇게 딱 두 파트에서만 쓰이는 게 맞나요? 기출 3회 노트에서는 pred = rf.predict_proba(X_val)[:,1] 과 roc_auc_score(y_val, pred) 그리고 pred = rf.predict_proba(test)[:,1] 이렇게 쓰셨는데 시나공 교재에서는 제가 위에 썼던 것처럼 풀이가 돼있습니다

jisung0928 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

47

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2유형 질문입니다!

pred = rf.predict(test) result = pd.DataFrame({"pred" : pred}) result.to_csv("result.csv",index = False)pred = rf.predict(test) submit = pd.DataFrame({"pred" : pred}) submit.to_csv("result.csv",index = False) pd.read_csv로 찍어보면 두 코드다 동일한 결과를 보이는데마지막 제출단계에서 아래 코드 submit 말고 위에 코드 처럼 result를 사용해서 제출해도 상관 없을까요?

병훈 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

43

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 모델 성능 향상

혹시 회귀든 분류든 랜덤포레스트 model 정의할 때 코드 안에 max_depth를 3~12 범위 내로 변화하면서 error나 score 점수 변동 확인해서 error의 경우 낮은 값, score의 경우 높은 값 나오도록 유도해도 될까요?

s93610 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

45

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

실제환경 작동 상황 문의

실제 환경에서 문제 풀어보는 중인데, 이렇게 자동으로 밑줄 쳐지고 ctrl+/를 동시에 눌러도 주석 처리되지 않고 그냥 드래그한 코드 사라지고 /만 남는 오류? 같은 상황이 종종 나오는데 이럴 땐 어떻게 하면 좋을까요...?

s93610 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

41

답변

1
미해결
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

이런거 질문을 해도 될지 고민은 되지만 직업형 3 문제에서

작업형 3유형에서 강의의 예시 문제들은어떤 검정이다라는게 제목으로 있는데 실제 문제에서도 단일표본검정이다독립표본검정이다 이런것을 알려주나요?실제 체험환경에 문제를 보면 이건 없는거 같아서요.문제를 보고 어떤 검정을 해야 하는지 판단하는게 맞지요?혹시 이럴때 어떤 검정을 해야 하는지 뭘 보고 어떻게 판단하면 좋을까요?

byun502 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

1

조회수

76

답변

1
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 연습문제2 원핫인코딩 질문

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요선생님께서 컬럼의 수가 많으면 원핫인코딩시 자료가 너무나 방대해진다고해서 해당 문제에서((4198, 21), (1499, 20)) 다음과 같이 컬럼의 수가 많아 라벨인코딩을 하려했습니다 그런데 선생님은 원핫인코딩을 하셨더라구요? 그렇게 해도 되는건가요? 그리고 제가 궁금해서 원핫인코딩후의 shape를 찾아보니 (4198, 29) (1499, 29) 으로 컬럼의 수가 별로 안늘어났는데 왜 이런거죠?? 알려주시면 감사하겠습니다 ㅠㅠ

gamb21 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

53

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2 연습문제 풀이 4

target = train.pop('target') cols = ['gender', 'enrolled_university', 'education_level', 'major_discipline', 'experience', 'company_size' , 'company_type', 'last_new_job'] for col in cols: train[col] = train[col].fillna(train[col].mode()[0]) test[col] = test[col].fillna(test[col].mode()[0]) from sklearn.preprocessing import LabelEncoder cols2 = train.select_dtypes(include='O').columns for col in cols2: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col])# 결측치 처리 train = train.fillna("X") test = test.fillna("X") # train과 test 합쳐서 원핫인코딩 combined = pd.concat([train, test]) combined_dummies = pd.get_dummies(combined) n_train = len(train) train = combined_dummies[:n_train] test = combined_dummies[n_train:]저는 위의 방식으로 풀었고 풀이는 아래 방식으로 풀었는데, result.csv에서 roc_auc 결과를 비교하면 많이 다르게 나타납니당... 예를 들어 같은 인덱스임에도 제 방식에서는 roc_auc가 0.2로 나오는데 풀이에서는 0.02가 됩니다. 이 경우에는 풀이에 따라서 0,1로 완전히 다르게 인식되는데도 점수 받는데 상관이 없을까요..?

s93610 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

39

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

인코딩

인코딩을 할 때 train에 test가 다 포함이 돼서 레이블 인코딩이 좋다 하셨는데 그렇게 판단해서 레이블만 하고 원핫을 안해도되나요? 평가지표를 써야해서 어쨌든 둘다 코드를 넣어놓고 비교를 했는지 까지 보는건가요? 채점할 때 그런거도 보는건지 궁금합니다.

박수현 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

40

답변

2

인기 태그

주간 인기글