묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3
작업형2에서는Import pandas as pdtrain = pd.read_csv()train = pd.read_csv()여기까진 작성되어있다고 하셨는데 작업형3에서는import pandas as pddf=pd.DataFrame~~~이것도 작성되어있나요?실지 시험에서 바로from scipy import stats~~들어각거나 작업해도되는지 궁금합니다 2 문제에서 정규성 따른다 말 없으면Shapiro부터하는거 맞죠?Shapiro에 피밸류가<0.05이면 귀무가설 기각인데여기서 귀무가설은 정규분포를 따른다 니까 이걸 기각하면결국 정규분포를 따르지 않아서-> 비모수검정으로 가는거 맞을까요? 3.“{:.11f}”.format~ 이랑 ”{:.10f}”.format은 차이점이 뭔가요??이렇게 했을때 실제 값에서 반올림? 되는거 같던데 그냥 실제로 소수점 해서 적는거랑저렇게해서 끝자리수가 조금 다르게 나와도둘다 정답으로 처리해주나요? 4 보통 summary에서 나오는 값을 바로적는거랑코딩으로 해서 나올때 반올림으로 끝자리수가 차나지만 그냥 바로 summary 보고 바로 적어도 다 정답처리해주는지 궁금합니다 감사합니다 감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
t검정에서 등분산과 정규성 검정 안 해도 되나요?
등분산검정은 대응과 단일에더 필요하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2
오브젝트 데이터가 없을 때는레이블인코딩이나 원핫인코딩 안하고분리부터해도되나요?분리는 반드시 해야하는거죠?? 랜덤포레스트할때는 스케일 영향이 크지 않다고 적혀있던데, 스케일 안하고 바로 해도되나요??감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 체험환경
실기 체험환경에서 할 때 복사, 붙여넣기하고 앞부분 혹은 중간부분만 수정을 하려고 하면 끼워넣어지는 게 아닌 뒤 글자가 삭제되어서 결국에는 다시 다 작성을 하게 되는데 다른 방법 있을까요?예를 들어train.shape 을 복사, 붙여넣기하고 앞에 test로만 수정하려고하는데 shape이 지워져서 결국 전체 다 작성하게 되는 경우입니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로우데이터
시험에서 csv를 제공하면06:00 로우데이터 부분은 공부하지 않아도 되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
귀무,대립 판별 헷갈림
P-value가 0.5 아래면 귀무(정규따름), 0.5 위면 대립(정규X,연구자주장) 으로 알고있는데 혹시 제가 잘 못 알고 있는 걸까요? 02:00P-value값이 0.0496이면 0.5보다 작아서 귀무가설 채택이 아닌가요? 헷갈립니다.. 제가 잘 못 이해하고 있는 것 같아요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분산분석 관련 질문
분산분석에서 일원이던, 이원 분산분석이던, 무조건 독립변수에 C()로 감싸줘야 하나요?지금까지 3유형에서 ANOVA(분산분석) 관련 문제가 나온적이 있는지 궁금합니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩, 레이블인코딩 사용
원핫인코딩, 레이블인코딩 사용방법에 관한 질문입니다.둘 중 아무거나 사용해도 상관은 없는데 어떤 수가 작으면 유니크 수가 작으면 원핫인코딩으로 하는 게 수월하다라는 내용을 이전 강의 때 들은 것 같습니다.제가 잘 기억하고 있는지는 모르겠지만.. 06:00 한가지 컬럼에서(ID)만 수가 크게 나올 시에는 레이블인코딩을 사용하는 것이 맞을까요?레이블인코딩과 원핫인코딩 중 하나만 기억날 시 기억나는 거라도 작성해서 제출해도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Claassifier, Regressor 사용
랜덤포레스트를 외울 때 Classifier로만 외우다보니 오류가 나서 재확인을 해봤습니다.Regressor도 붙여서 사용하더라고요.제가 한가지만 외워서 오류가 났던 걸 확인했습니다.질문드릴 점은 언제 어떤걸 쓰는지가 구분이 안됩니다...
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 코드 암기 확인 부탁드립니다!!
안녕하세요 강사님 ^^다름이아니라 시험 전 2유형 코드 여쭤보려고 질문 남깁니다!2유형 이렇게만 하면 될까요? 중간에 검증과 평가를 제외해서,, 확인 한번만 부탁드립니다! target = train.pop('타켓명')train = pd.get_dummies(train)test = pd.get_dummies(test)test = test.reindex(columns=train.columns, fill_value=0) #train과 test 컬럼명이 다르다면 수행 from sklearn.ensemble import RandomForestClassifier/Regressorrf = RandomForestClassifier/Regressor(random_state =0)rf.fit(train, target) pred = rf.predict(test)submit = pd.DataFrame({'pred':pred})submit.to_csv("result.csv', index=False)print(pd.read_csv("result.csv").head()) #제출파일확인print(pd.read_csv("result.csv").shape) #제출파일확인
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 3회 기출 1번 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 문제 1번의 경우 결측치 행을 제거하면 행이 51개가 나오는데 앞에서부터 70퍼면 35.7 이라는 숫자가 나옵니다. 문제에서 반올림 할건지 버림으로 정수형으로 나타내는지 언급이 없어서 두 방법을 사용할때의 답이 다른데혹시 복수정답의 여지는 없나요? 문제에서 표현이 명확하지 않은 것 같습니다. 아니면 이렇게 모호할때는 버림으로 정수형 나타내는게 정배인가요? 감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오류율 pop 질문입니다.
오류율을 구할때 target을 pop하지 않아도 되는건가요?이전 강의에선 pop을 했던것같은데, 연습문제 9.로지스틱 회귀 8번 정확도에서 pop하지 않는데 상관없나요?target = test.pop('gender') pred = model.predict(test) > 0.5accuracy = accuracy_score(target, pred) print(1-accuracy)# 8. 정확도 pred = model.predict(b) pred = (pred > 0.5).astype(int) from sklearn.metrics import accuracy_score accuracy = accuracy_score(b['target'], pred) print("8.", accuracy)
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[기출 10회] 작업형2 target변수 결측치 처리
안녕하세요. 기출 10회를 다시 풀어보고 있는데, 작업형 2에서 타겟 변수에 0이 있는 경우를 처리를 하는지 안하는지에 따라 rmse 값이 차이가 꽤 크더라구요. 이렇게 차이가 꽤 있는데도 결측치를 처리한 경우와 안한 경우 둘다 만점을 받을 수 있던 문제였나요? #타겟변수에서 결측치를 제거한 경우의 rmse rf_rmse = 673.8026644431536 #타겟변수에서 결측치를 제거하지 않은 경우의 rmse rf_rmse = 960.485846380754
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코드 한번 봐주실 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분포
08:51타겟 시각화는 어차피 지원 안한다고 하였고..분포도 꼭 외워야 할까요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀나 분류 둘 다 예측을 랜덤이랑 lgb로만 평가해도 되너요?(선형이나,xgb말고요)!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pvalue 5.8686553916715e-06) 이렇게 적어도 되나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요굳이 포맷 써서 안바꾸고 아래처럼만 제출해도 상관없나요?5.8686553916715e-06)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 자료 위치
안녕하세요 급하게 강의를 시작하게 되어서 몇개씩만 빠르게 수강중입니다. 죄송하지만 빠르게 수강중이라 놓친 내용들이 많아서 질문드립니다. 혹시 강의에서 나온 내용들이 정리되어 있는 사이트나 직접 연습을 해볼 수 있는 사이트가 있을까요? 강의 처음에 read_csv() 를 불러올때 파일 등이 있는 위치가 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pred[:,1]가 쓰이는 위치 관련 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요roc_auc_score 가 평가지표로 지정된 분류문제에서 rf.fit(X_tr, y_tr)로 학습하고pred= rf.predict_proba(X_val) 로 pred를 만든 후from sklearn.metrics import roc_auc_scoreroc_auc_score(y_val, pred[:,1]) << 이 부분과pred=rf.predict_proba(test)result= pd.DataFrame({'pred': pred[:,1]}) << 이 부분 이렇게 딱 두 파트에서만 쓰이는 게 맞나요? 기출 3회 노트에서는 pred = rf.predict_proba(X_val)[:,1] 과 roc_auc_score(y_val, pred) 그리고 pred = rf.predict_proba(test)[:,1] 이렇게 쓰셨는데 시나공 교재에서는 제가 위에 썼던 것처럼 풀이가 돼있습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 질문입니다!
pred = rf.predict(test) result = pd.DataFrame({"pred" : pred}) result.to_csv("result.csv",index = False)pred = rf.predict(test) submit = pd.DataFrame({"pred" : pred}) submit.to_csv("result.csv",index = False) pd.read_csv로 찍어보면 두 코드다 동일한 결과를 보이는데마지막 제출단계에서 아래 코드 submit 말고 위에 코드 처럼 result를 사용해서 제출해도 상관 없을까요?