묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 빅분기 실기 2유형 시험간 헷갈리는 부분
MinMaxScaler + one-hot encoding lightgmb(n_estimator = 300) +mae 사용하여 예측하였는데 (mae : 93~94) 예측값이(인원수) 2096개(?)중에서 음수가 11개 나오더라고요.이렇게 예측값이 양수가 나와야하는 경우 보통 음수에 대해 후처리를 한번 더 해서 내보내는건지, 아니면 상관이 없는건지 궁금합니다...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 시험 작업형2
선생님 제가 풀었을때는 pred값이 소수 셋째자리까지 나오는데 시험 제출예시에서는 깔끔하게 정수로 되어있길래 마지막에 pred.astype(int)로 바꿔서 제출했는데 혹시 문제될까요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 답 복기
작업형1313 / 239 / -0.026 작업형2lightgbm 하이퍼파라미터튜닝으로mae 92정도 작업형3-(1)12 / -0.456 / 7.919 작업형3-(2)2.129 / 0.313 / 104.873 랜포보다 lgb가 성능이 더 좋길래 썼는데 나중에 pre 데이터 min값 찍어보니 음수 나오더라구요 ㅠ 이러면 감점 혹은 0점 처리될까요...?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험후기
기억나는 문제 쭉 적어 봅니다. 유형1 3번민맥스 정규화 라고 나와서 당황 했는데그냥 민맥스 스케일로 풀었습니다 ㅎㅎ 유형2mae로 평가하는 회귀문제원핫인코딩만 하고 랜덤포레스트 돌렸을때mae값 93? 95? 쯤 나와서 그냥 제출했습니다. 유형3-1로지스틱 회귀문제유의하지 않은 변수가 몇개인지 쓰는문제2.1에서 나온결과 유의한 변수로 로지스틱 모델 다시 만든 회귀계수 값 평균 만들기시험푸는 중간에 알림으로 ???가 유의하면 포함해서 계산? 하라는내용이 왔습니다.그래서 절편? 도 포함해서 계산했는데 맞는지 모르겠네요.. 새로운 값을 넣어서 값을 예측하는 문제3-2.특정변수 가 5 변할때 오즈값이 얼마나 변하는지?오즈비 구해서 *5 해버렸습니다.. 맞을지 모르겠네요합격했으면 좋겠습니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 , 3유형 코드제출 여부
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요좋은 강의 덕분에 오늘 시험을 잘마쳤습니다!다만 시험을 끝내고 결과확인을해보니답안은 모두 제출하였습니다만…작업형 1/3유형 풀이 (코드) 부분이 미제출로 나와서 이부분이 문제가 되지 않을까 걱정되어 문의 드립니다. 혹시 코드가 제출더ㅣ지 않으면 문제가 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 7회 - 작업형2
fit 전까지는 잘 실행되었는데 저기서부터 막히네요 ㅠㅠ unknown label type: continuous는 뭘까요,,
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse
작업형2에서 rmse 반복문을 못쓸거 같은데 그냥 sklearn에서 mse 불러와서 **0.5만 써서 프린트해도 될까요,,, ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 2회 작업형 2 오류 pred[:,1]
해당 오류가 뜨는 이유는 무엇일까요,,?from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr,y_tr) pred = rf.predict_proba(X_val) from sklearn.metrics import roc_auc_score print(pred) print(roc_auc_score(y_val, pred[:,1])) [array([[0. , 0. , 0. , ..., 0. , 0. , 0. ], [0. , 0. , 0.01, ..., 0. , 0. , 0. ], [0. , 0. , 0. , ..., 0. , 0. , 0. ], ..., [0. , 0.01, 0. , ..., 0. , 0. , 0. ], [0. , 0. , 0. , ..., 0.01, 0. , 0. ], [0. , 0. , 0. , ..., 0. , 0. , 0. ]]), array([[0. , 1. ], [0.5 , 0.5 ], [0.71, 0.29], ..., [0.03, 0.97], [0.71, 0.29], [0.19, 0.81]])] --------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-41-e325cda04cf0> in <cell line: 3>() 1 from sklearn.metrics import roc_auc_score 2 print(pred) ----> 3 print(roc_auc_score(y_val, pred[:,1])) TypeError: list indices must be integers or slices, not tuple
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델링 및 평가(분류)
선생님. 해당 수업 자료에서 object 값을 label encoding 시도했는데 이런 오류가 뜹니다.. 혹시 어떤 것이 문제일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 다항회귀분류
2유형 다항회귀분류로 roc-auc로 평가하는 경우는 predict_proba 로 나온 결과값 그대로 제출하나요?이항회귀분류의 경우에는 1인 경우의 확률만 뽑아서 제출했는데, 다항의 경우는 어떻게 되는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
상관계수 큰 값
상관계수가 -0.4 , 0.3 두개가 있는 경우 ‘상관계수의 절댓값’이 큰 경우를 구하라 하면 -0.4가 맞는데 ‘상관계수의 최댓값’을 구하라고 하면 어떤게 될까요?? 가장 강한 상관관계를 물었으면 -0.4 상관계수가 큰 걸 물었으면 0.3이 맞을까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수업 노트 보기 코드1
한 번에 풀기로 모델 만들어보고 에러 나오면 수업 노트 보기 코드1에 나와있는 코드로 모델 만들어서 제출하려고 하는데, 검증용 데이터 만드는 부분 없이 코드 제출해도 상관 없나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제2유형 답안 제출 관련 문의드립니다.
안녕하세요. 시험환경에서 제2유형 예시를 보면CSV 파일 형식 예시가 첨부파일 처럼 되어 있을 경우,회원ID 없이 아래처럼 제출하면 되는 걸까요? 그리고 답안 제출은result.to_csv('000.csv', index=False) 까지 입력한다음에 제출 버튼 누르면 되는 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
하이퍼 파라미터 튜닝 시 질문드립니다!
안녕하세요 강사님!하이퍼 파라미터 튜닝 시 궁금한게 있어서 질문드립니다! train_test_split() 으로 데이터를 분리해서 모델 성능을 검증할 때, 하이퍼 파라미터 중 max_depth 값을 1을 줬을 때 검증에서는 성능이 제일 좋게 나오는 경우 1 값 그대로 줘도 괜찮나요?? 뭔가 max_depth=1 은 실제 값을 예측 할 때 좀 위험(?)하지 않을까 하는 의문이 들어서 질문드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[심화] 시계열 데이터 2
선생님 timedelta 자료형에서시간 컬럼끼리 - 연산자는 되는데더하거나, 곱하거나, 나누기는 안되더라구요. 혹시 -만 가능한걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
에러코드.
이유좀 알려주세요!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2, 원핫인코딩
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요예시문제 작업형2에서 원핫인코딩(pd.get_dummies)를 하고 작업형 2 한가지 방법으로 문제 풀기를 하면 오류가 발생합니다train과 test의 object인 주구매상품의 유니크 수가 달라서 그런간가요? 유니크 수가 다른 경우 그 컬럼만 삭제하고 작업형2 한가지 방법으로 풀기와 동일한 흐름으로 문제를 풀어도 될까요?(아래 첨부한 코드처럼요!)train = train.drop(['주구매상품'], axis=1) test = test.drop(['주구매상품'], axis=1) print(train.shape, test.shape) train = pd.get_dummies(train) test = pd.get_dummies(test) print(train.shape, test.shape)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험볼때 2유형부터 풀수 있나요?
시험볼때 순서대로 1유형의 1번부터 풀어야 하는지 아니면 자기가 편한 순서대로 풀수 있는지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 관련 질문
작업형3에 크게 두 문제가 있는데 부분점수가 있나요?ex) 1-1 O, 1-2 X, 1-3 X / 2-1 X, 2-2 X, 2-3 X1-1만 정답이고 나머지는 틀렸다면 부분점수가 있나요?!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 3 - 로지스틱 회귀 질문입니다.
위 문제에서, 독립변수로 income, 종속변수로 purchase 를 사용해 logit 로지스틱 회귀 모델을 만들어 학습하고나서, 예측을 할 때, test 의 test["income"] 을 predict( ) 함수 안에 넣어야 하는거 아닌가요?캐글 풀이에서는 test 전체를 넣어서 혼란이 옵니다. 그리고 이 문제에서 모델의 유의확률을 구하라고 했는데요.특정 독립변수의 PVALUE 가 아니라 모델의 P VALUE 이므로 위 model.summary() 에서 오른쪽 아래 쯤에 있는 LLR p-value 아닌가요?이 문제에서는 단순선형회귀라서 독립변수 income 의 p value와 LLR-P value 가 같긴 합니다만,만약 독립변수가 여러 개 이고, 모델의 pvalue를 구하라고 하면 LLR- P VALUE 가 맞을까요?