묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
10회 실기 작업형2 문제 관련 문의
이슈였던 결측치(0) 전처리 작업없이 그대로 두고가장 기본적으로 라벨인코딩 / 랜덤포레스트 적용했는데, 평가 점수가689 나오더라구요...!! 가장 기본적으로 해야되는 것들만 적용해서 나온 점수인데, 많은 분들 점수대는 400후반 ~ 500중반 미만으로 나왔다고 해서 조금 걱정이 듭니다ㅠ 간격에 대해서 기준은 없지만, 600후반으로 나와도 어느정도 점수는 받을 수 있을까요~~??! 선생님 덕분에 빅분기 시험에 대해서 포기하지 않고 끝까지 공부하여 시험까지 잘 마무리한 것 같습니다~!여러 질문들에 대해서 빠르고 친절한 답변도 항상 감사했습니다!!^^
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 10회 작업형 2유형
실기 10회 작업형 2유형object 컬럼 하나 있던거 train, test에서 각각 제거int형이라서 인코딩 안하고 진행 ..rmse 590.xx 점 나옴 ..이런 풀이로 점수는 받을 수 있을까요 .. ㅋㅋㅋ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기시험 복기는 없을까요 ?
1유형 2유형 3유형 시험 복기는 없을까요 ? 1유형 1-1번 / 1-2번40만 ? 43만 ? / 20만 1유형 2번1유형 3번 2유형은 RMSE 530정도 나왔습니다.근데 결측치 이야기가 있던데 isnull().sum() 했을 때 타겟 변수에 결측치가 없었는데,결측치는 0으로 표시된다? 라는 내용이 있긴 했으나.. 별도 결측치 처리를 안 했는데 여러분은 어떻게 하셨나요? 그리고 3유형에 오즈비 구하는 문제에 값이 2 증가한다는 가정이 있었나요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기10회 풀이
10회 실기를 치고왔습니다작업형2.3은 무난했던거같은데 작업형1은 조금 어려웠습니다혹시 풀이강의가 있을까요??
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출10회 작업형2 결측치처리
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요타겟에 결측치가 있는 것에 대해 처리를 안하고 제출했는데그러면 무조건 틀리나요..?ㅠ점수는 잘 나왔습니다
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
딴짓님 질문있습니다
이번 10회 실기시험 1유형 3번 문제가 띄어쓰기 제외하고 단어 수 세는거였는데 저는 (띄어쓰기 전 문장의길이 - replace로 띄어쓰기 지운 문장의길이) + 1 해줬는데 단어 개수가 이렇게해도 세어질까요??10개정도 확인했을땐 다 맞아서 그냥 그렇게 풀었는데 저처럼 푼 사람이 없는 것 같아 여쭤봅니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 질문 있습니다
안녕하세요 우선 늦게 질문 남기는 점 죄송합니다다름이 아니라 시험환경 관련해서 질문이 있습니다. 기존 강의에서 코랩에서 코딩을 할 때 이전 셀 실행 기능이 있어 유용하게 사용했는데시험 환경에서 같은 기능을 사용하려면 어떻게 해야하는지 궁금합니다. 추가적으로 코드 라인별 실행 불가라고 되어있는데 순차적으로 실행하면서 진행하는건 가능할까요?예를 들어 2유형이라고 치면 전처리 하고 결과 보고 이후 그 밑에 코드 이어서 인코딩 진행한 후 결과 보고 모델 돌리고 결과 보고 이런식으로 순차적으로 코드 작성하면서 실행 결과 확인하는게 가능한지 궁금합니다.
-
미해결파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
unrecognized arguments: --force
(myenv-finance-analysis) C:\Users\sanghun\env_yaml>conda env create --force -f myenv-finance-analysis.yamlusage: conda-script.py [-h] [-v] [--no-plugins] [-V] COMMAND ...conda-script.py: error: unrecognized arguments: --force 위에같이 --force 를 인식할 수 없다고 뜨네요, 어떻게 해결해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3과목 유형
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요3과목 공부할 시간이 너무 없어서그러는데강의에서 심화라고 나오는건 일단은 건너뛰어도 될까요? 3과목은 한문제라도 맞추는게 목표입니다.ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7회 작업형3 1-3
아래 문제를 제가 혼자 다시 풀었을 때, 처음에 model = logit(formula,test).fit()이라고 test데이터로 모델을 학습해서 답이 안나왔었습니다.작업형2에서 배웠던 머신러닝의 train, test의 개념이 동일하게 적용되어학습은 무조건 test가 아니라 train데이터로 진행하는 걸 대전제로 이해하면 될까요? 기출7회 작업형3 / 문제1-3. 독립변수 weight 만 사용해 학습한 로지스틱 회귀모델에서 test데이터의 gender를 예측하고, error rate(오류율)를 구하시오. (반올림하여 소수 셋째자리까지 계산)import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/7_3/clam.csv") # train test 나누기 train = df.iloc[:210] test = df.iloc[210:] # print(train.shape, test.shape) (210, 6) (90, 6) # logit from statsmodels.formula.api import logit formula = 'gender ~ weight' model = logit(formula,train).fit() # test데이터의 gender 예측 pred = model.predict(test) print(pred) pred_ver2 = pred > 0.5 from sklearn.metrics import accuracy_score AS = accuracy_score(test['gender'],pred_ver2) ER = 1 - AS print(round(ER,3))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 코드
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 퇴근후딴짓님 강의 잘 듣고 있습니다 🙂다름이 아니라 2유형 코드 제출 시 제가 확인하려고 써둔 코드인1) 평가 지표 코드ROC_AUC / RMSE 등등from sklearn.metrics import roc_auc_score2) 생성 csv파일 확인 코드print(pd.read_csv("r.csv").head()위의 두 코드를 주석처리하거나 지운 후 맨 마지막 코드가 submit.to_csv가 되도록 하여 제출해야하는지 궁금합니다 !감사합니다 !!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 3 문제 2-1번
logit에서 독립변수를 쓸 때 HasPhoneService와 HasTechInsurance에 C를 붙여주지 않는 건 그저 문제에 범주형이라고 나오지 않았기 때문인가요?그럼 데이터가 범주형으로 나와있어도 문제에 범주형이라고 써져 있지 않다면 C를 쓰면 안되는건가요? 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2-2 오즈비 질문
안녕하세요 강사님 2-2에서 오즈비를 np.exp(model.params['HasPhoneService'])를 통해서 구했는데 강사님과 제 답이 달라서 질문드립니다. 저는 0.692가 나왔습니다0.701이 나오려면 np.exp에 model.summary() 통해서 HasPhoneService의 회귀계수 -0.3681을 직접 복붙해 넣으면 0.701이 나오더라구요..어디서 잘못된건지, 시험에서는 어떤 방식을 써야할지 모르겠어 여쭤봅니다ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 2-2 오즈비 구하실때 왜 그게 오즈비인가요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요부연설명도 조금 해주세요. 전화서비스를 받지 않은 고객이 이탈할 확률 대비, 전화 서비스를 받은 고객이 이탈할 확률에 대한 오즈비가 단순히 HasPhoneService에 대한 회귀계수 집어넣는 이유가 뭐에요? 나중에 또 이런문제가 나왔을때 그걸 판단하는 방법을 알려주세요... ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 7회 작업형 1-3
안녕하세요. 질문이 있습니다.기출 7회 작업형 1-3 문제에서 저는 강사님처럼 gender 컬럼을 pop하지 않고 그냥 바로 test 데이터를 넣어 예측하였습니다. 강사님이랑 결과는 동일하게 나오는데 혹시 gender 컬럼을 꼭 분리해야 할까요? 사실 test 안에는 weight 말고도 다른 독립변수들이 같이 있잖아요.근데 모델이 독립변수로 weight을 사용하여 종속변수 gender를 예측하는 모델이니까자동으로 test 안의 weight 변수만 사용한다고 생각하고 있는데 틀린 생각인가요? from statsmodels.formula.api import logit # 1) 로지스틱 회귀모델 적합 model = logit('gender ~ weight', data = train).fit() # 2) test 데이터의 gender 예측 (남자로 분류되는 기준을 0.5로 임의 설정) pred = model.predict(test) > 0.5 # print(sum(pred)) # 3) error rate 구하기 from sklearn.metrics import accuracy_score acc = accuracy_score(test['gender'], pred) er = 1 - acc print(round(er, 3)) # 0.478
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2과목 점수 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요공부 시간이 많아서 2과목을 강의대로 하면 좋겠지만 시간이 없어서1.데이터 전처리(결측치 제거 정도)2.인코딩(데이터 별로 없을 시 원핫 or 많을 때 레이블인코딩)3.랜덤포레스트 학습 이렇게 제출 했을 경우 보통 몇점 정도 나오는지 혹시 수강생들 후기가 있으신가요..?30점 정도만 나와도 다행일 것 같긴합니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 기출, 작업형3 문제 1-2 와 2-2 비교
문제 1-2 에서는 소수 둘째짜리까지 구하라고 하여함수 llf 를 구해서 소주 셋째짜리까지 구한 후, 반올림했는데 문제 2-2에서는 셋째짜리까지 구하라고 했으니, 넷째짜리까지 보고서 답을 적어야 하는데선생님은 summary() 표에서 나오는 결정계수(소수 셋째짜리) 로 우선 답을 적으셨는데요.(이후에 rsquared 함수로 더 많이 소수자리를 보긴했지만) 문제 2-2에서 결정계수 값이 0.226 인데, 만약 0.2253 이였으면 반올했을때 0.225 가 되잖아요..? 그럼 틀린건가요? 선생님 풀이를 보면 1-2와 2-2의 차이가 분명히 있는데, 1-2 문제에서는 구하라고 하는 소수자리보다 더 많이 구한후 답을 적엇고, 문제 2-2에서는 그냥 표에있는 값으로 답을 적었는데요.. 한가지 방법으로 정리가 필요할듯 합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
잔차 이탈도 계산
선생님은 잔차이탈도 계산은 함수를 써서로그 우드 값을 추출 후 곱하기 -2를 해서 = 286.93267518507366 여기서 반올림해서 286.93이 되고 저는 summary() 로 알게된 로그우드 값에 곱하기 -2를 해서 = 286.94이 됩니다. 이럴경우 제가 한 답을 작성시 틀리게 되는건가요? summary 에서 -143.47 이렇게 애초에 소수 둘째짜리 까지만 나타내줫는데.. 틀리면 억울할거같은데 답변 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 제출
안녕하세요.2유형 답안 제출할 때 위에서 EDA 를 print해서 본거랑, 안 쓸 머신러닝들 문장은 주석 처리해서 답안 제출해야 되나요??아니면 print있어도 상관없나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1-2 행별합 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요풀이 코드에는print(a.sum(axis=1))이렇게 작성이 되어있는데print(a.T.sum())이렇게 해도 되나요?