질문 & 답변 - 인프런 | 커뮤니티

묻고 답해요

169만명의 커뮤니티!! 함께 토론해봐요.

인프런 TOP Writers

해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

평가지표별 높고 낮음의 좋은것은?

내일 모두 빅데-실기 합격을 기원합니다.기본적인 질문을 드립니다.작업형2관련하여 여러가지 평가지표들이 있는데전처리 및 랜덤포레스트,LightGBM등으로 작업후회귀의 ***E로 끝나는 평가 지표는 낮은것이 좋고, 나머지 지표들은 결과가 높게 나오는 것이 좋은 것인가요?

ham2638 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

49

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

범주형 변수

문제에서 범주형이라고 명시된 변수만 C()예:ols("y ~ x1 + region", data=df) 숫자로 되어 있다고 해서 자동으로 범주형 처리하는 것은 잘못문제에서 “범주형 변수이다”라고 하지 않은 숫자형은 연속형으로 취급 ❌3. 로지스틱 회귀( logit)➡ols와 동일 원칙예:logit("target ~ x1 + job_type", data=df) logit 는 문제에서 “범주형”이라고 적혀 있을 때만 C() 필요.그 외에는 절대 알아서 C() 넣지 않음.범주형변수 관련 글을 봤는데 범주형 변수일ㄸㅐPd.get dummies(drop_first=Ture) 원핫인코딩처리 이것도 보았는데작업형3에서도 인코딩을 해여하는건가요??위의 내용이랑 아래내용이랑 어떤 관련이있는지 헷갈립니다ㅠ 감사합니다

합격 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

43

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

문제 7번을 df.T 로 변환해서 풀어도 되는지 궁금합니다!

안녕하세요! 문제 7번을 풀어보는데, 이런식으로 T로 행열을 변환하여 푸는것은 안되는 것인가요?!답이 다르게 나오기도 하고.. 이 풀이법이 틀린건지 질문을 드립니다..! ㅎㅎ

eun0v0 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

43

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

8회 작업형2 질문

원래는 drop을 하지 않고도 빅이시에서 말씀하신대로 돌리면 제대로 돌아갔는데 8회회귀는 위의 이미지대로 customerID쪽의 문제라고 에러문제가 나옵니다.실제 시험장에서는 오류가 발생하면 오류메세지를 통해 customerID컬럼인것을 인지하고이후 드랍을 진행하는 방식을 하면 될까요?(EDA를 하지않는다고 가정할때입니다.)

오승택 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

53

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

80%의 데이터만 사용한다는 문제에서 .iloc가 아닌 df[:]로 바로 사용해도 되나요

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요

김서현 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

51

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형3

작업형2에서는Import pandas as pdtrain = pd.read_csv()train = pd.read_csv()여기까진 작성되어있다고 하셨는데 작업형3에서는import pandas as pddf=pd.DataFrame~~~이것도 작성되어있나요?실지 시험에서 바로from scipy import stats~~들어각거나 작업해도되는지 궁금합니다 2 문제에서 정규성 따른다 말 없으면Shapiro부터하는거 맞죠?Shapiro에 피밸류가<0.05이면 귀무가설 기각인데여기서 귀무가설은 정규분포를 따른다 니까 이걸 기각하면결국 정규분포를 따르지 않아서-> 비모수검정으로 가는거 맞을까요? 3.“{:.11f}”.format~ 이랑 ”{:.10f}”.format은 차이점이 뭔가요??이렇게 했을때 실제 값에서 반올림? 되는거 같던데 그냥 실제로 소수점 해서 적는거랑저렇게해서 끝자리수가 조금 다르게 나와도둘다 정답으로 처리해주나요? 4 보통 summary에서 나오는 값을 바로적는거랑코딩으로 해서 나올때 반올림으로 끝자리수가 차나지만 그냥 바로 summary 보고 바로 적어도 다 정답처리해주는지 궁금합니다 감사합니다 감사합니다

합격 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

37

답변

1
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

t검정에서 등분산과 정규성 검정 안 해도 되나요?

등분산검정은 대응과 단일에더 필요하나요?

김서현 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

176

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형2

오브젝트 데이터가 없을 때는레이블인코딩이나 원핫인코딩 안하고분리부터해도되나요?분리는 반드시 해야하는거죠?? 랜덤포레스트할때는 스케일 영향이 크지 않다고 적혀있던데, 스케일 안하고 바로 해도되나요??감사합니다

합격 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

42

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

실기 체험환경

실기 체험환경에서 할 때 복사, 붙여넣기하고 앞부분 혹은 중간부분만 수정을 하려고 하면 끼워넣어지는 게 아닌 뒤 글자가 삭제되어서 결국에는 다시 다 작성을 하게 되는데 다른 방법 있을까요?예를 들어train.shape 을 복사, 붙여넣기하고 앞에 test로만 수정하려고하는데 shape이 지워져서 결국 전체 다 작성하게 되는 경우입니다..

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

53

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

로우데이터

시험에서 csv를 제공하면06:00 로우데이터 부분은 공부하지 않아도 되는건가요?

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

37

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

귀무,대립 판별 헷갈림

P-value가 0.5 아래면 귀무(정규따름), 0.5 위면 대립(정규X,연구자주장) 으로 알고있는데 혹시 제가 잘 못 알고 있는 걸까요? 02:00P-value값이 0.0496이면 0.5보다 작아서 귀무가설 채택이 아닌가요? 헷갈립니다.. 제가 잘 못 이해하고 있는 것 같아요.

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

58

답변

3
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

분산분석 관련 질문

분산분석에서 일원이던, 이원 분산분석이던, 무조건 독립변수에 C()로 감싸줘야 하나요?지금까지 3유형에서 ANOVA(분산분석) 관련 문제가 나온적이 있는지 궁금합니다~!

ryj0330 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

56

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

원핫인코딩, 레이블인코딩 사용

원핫인코딩, 레이블인코딩 사용방법에 관한 질문입니다.둘 중 아무거나 사용해도 상관은 없는데 어떤 수가 작으면 유니크 수가 작으면 원핫인코딩으로 하는 게 수월하다라는 내용을 이전 강의 때 들은 것 같습니다.제가 잘 기억하고 있는지는 모르겠지만.. 06:00 한가지 컬럼에서(ID)만 수가 크게 나올 시에는 레이블인코딩을 사용하는 것이 맞을까요?레이블인코딩과 원핫인코딩 중 하나만 기억날 시 기억나는 거라도 작성해서 제출해도 될까요?

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

80

답변

3
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

Claassifier, Regressor 사용

랜덤포레스트를 외울 때 Classifier로만 외우다보니 오류가 나서 재확인을 해봤습니다.Regressor도 붙여서 사용하더라고요.제가 한가지만 외워서 오류가 났던 걸 확인했습니다.질문드릴 점은 언제 어떤걸 쓰는지가 구분이 안됩니다...

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

50

답변

2
미해결
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2유형 코드 암기 확인 부탁드립니다!!

안녕하세요 강사님 ^^다름이아니라 시험 전 2유형 코드 여쭤보려고 질문 남깁니다!2유형 이렇게만 하면 될까요? 중간에 검증과 평가를 제외해서,, 확인 한번만 부탁드립니다! target = train.pop('타켓명')train = pd.get_dummies(train)test = pd.get_dummies(test)test = test.reindex(columns=train.columns, fill_value=0) #train과 test 컬럼명이 다르다면 수행 from sklearn.ensemble import RandomForestClassifier/Regressorrf = RandomForestClassifier/Regressor(random_state =0)rf.fit(train, target) pred = rf.predict(test)submit = pd.DataFrame({'pred':pred})submit.to_csv("result.csv', index=False)print(pd.read_csv("result.csv").head()) #제출파일확인print(pd.read_csv("result.csv").shape) #제출파일확인

권재경 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

70

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 3회 기출 1번 질문

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 문제 1번의 경우 결측치 행을 제거하면 행이 51개가 나오는데 앞에서부터 70퍼면 35.7 이라는 숫자가 나옵니다. 문제에서 반올림 할건지 버림으로 정수형으로 나타내는지 언급이 없어서 두 방법을 사용할때의 답이 다른데혹시 복수정답의 여지는 없나요? 문제에서 표현이 명확하지 않은 것 같습니다. 아니면 이렇게 모호할때는 버림으로 정수형 나타내는게 정배인가요? 감사합니다

gamb21 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

36

답변

1
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

오류율 pop 질문입니다.

오류율을 구할때 target을 pop하지 않아도 되는건가요?이전 강의에선 pop을 했던것같은데, 연습문제 9.로지스틱 회귀 8번 정확도에서 pop하지 않는데 상관없나요?target = test.pop('gender') pred = model.predict(test) > 0.5accuracy = accuracy_score(target, pred) print(1-accuracy)# 8. 정확도 pred = model.predict(b) pred = (pred > 0.5).astype(int) from sklearn.metrics import accuracy_score accuracy = accuracy_score(b['target'], pred) print("8.", accuracy)

최유정 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

46

답변

2
미해결
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[기출 10회] 작업형2 target변수 결측치 처리

안녕하세요. 기출 10회를 다시 풀어보고 있는데, 작업형 2에서 타겟 변수에 0이 있는 경우를 처리를 하는지 안하는지에 따라 rmse 값이 차이가 꽤 크더라구요. 이렇게 차이가 꽤 있는데도 결측치를 처리한 경우와 안한 경우 둘다 만점을 받을 수 있던 문제였나요? #타겟변수에서 결측치를 제거한 경우의 rmse rf_rmse = 673.8026644431536 #타겟변수에서 결측치를 제거하지 않은 경우의 rmse rf_rmse = 960.485846380754

민지 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

39

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

코드 한번 봐주실 수 있나요?

김서현 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

46

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

분포

08:51타겟 시각화는 어차피 지원 안한다고 하였고..분포도 꼭 외워야 할까요 ㅠ

ska2994 · 7개월 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

25

답변

2

인기 태그

주간 인기글