묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결확률과 통계 101
증심극한정리
25장 중심극한정리에서 동전 던지기 실험에서분산을 구할때 분모를 n으로 나웠는데요.분모가 표본에 대한 거니 n-1이 맞이 않나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 7번 혼동
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제 7번에서 index '2001' 데이터(행)의 평균보다 큰 값의 갯수와index '2003' 데이터(행)의 평균보다 작은 값의 갯수를 더하시오위 말이 2001의 데이터행의 평균과 2001의 데이터를 비교해서 큰 값인지 df내 전체 데이터와 비교하라는 것인지 비교군이 명확하지 않아 혼동이 옵니다.설명 영상을 보고서야 같은 행에 대한 비교란 것을 알았습니다. 아래 2003도 마찬가지고요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검정 방법 질문입니다.
샤피로 검정하는 이유가 정규성을 충족하는지를 확인하기 위해 하는거라고 이해했는데 질문있습니다.만약 pvalue가 0.05보다커서정규성을 충족한다면 ttest로 하면 되나요?코드처럼 샤피로검정에서 pvalue가 0.05보다 낮으면 정규성을 충족하지 못하니 비모수검정인 윌콕슨을 하는건가요?그리고 시험에서 μd값도 기본적으로 알려주는지도 궁금합니다.
-
해결됨챗GPT와 파이썬으로 주식 자동매매 앱 및 웹 투자 리포트 만들기
pykrx 설치가 되지 않습니다.
numpy 1.23.4pandas 2.0.3버전으로 설치 했음에도 불구하고아래와 같이 pip install pykrx를 하게되더라도 오류가 납니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
nunique 값이 다를 때의 인코딩
안녕하세요,시나공 책을 보니 object 컬럼의 nunique 값이 다를 때는 train, test 데이터를 concat한 뒤 원핫 인코딩을 해주어야한다고 나와있는데 레이블 인코딩도 마찬가지인가요? 모의문제 2에서는 neighbourhood의 nunique값이 다른데 concat 없이 레이블 인코딩을 진행하신 것 같아서 질문 남깁니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
그룹바이 agg 함수에서 하나의 컬럼에만 적용시키는 방법
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요# 원산지와 메뉴 기준 (평균, 합계) df.groupby(['원산지','메뉴']).agg(['mean','sum'])# 원산지와 메뉴 기준 (평균, 합계) df.groupby(['메뉴']).agg(['mean','sum'], numeric_only=True)원산지와 메뉴기준으로 agg하여 mean 과 sum을 구했을때 코드를 알려주셨는데요, 원산지 하나의 칼럼의 mean과 sum을 보고싶을 때는 어떻게 해야하나요? 에러가 나네요,, 아마 원산지가 빠져서 문자열이라 그런거같은데, numeric_only = True을 어디에 넣어야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
똑같이 튜닝 그대로 하고 했는데도 마지막에 실제 y_test로 점수를 매겨봤는데 0.796정도네요
선생님과 모든 코드와 튜닝을 똑같이 하고 가장 최종적으로 y_test로 채점해보았는데 저는 0.79대로 나오네요 ㅜ 실제 이런 점수로 나오면 시험점수에 많은 영향을 끼칠 수준인가여
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
10분56초 강의에서(랜덤포레스트 깊이 설정)
선생님과 모든 코드를 똑같이 작성하고 똑같은 데이터로 하는데 왜 저는 평가값이 모두 다를까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 6분쯤에서요 output드랍
검증데이터 분리 코드 바로 전에 output을 드랍해서 train데이터에 다시 저장하셨는데다시 또 분리할때 output컬럼을 드랍해야하는 이유가 무엇일까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
답변 제출시 평가지표 넣어야하는지 문의
from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr, y_tr) pred = rf.predict_proba(X_val) 촉박하게 공부하다 보니 평가지표에 대한 이해가 잘 되지 않는데요, 제출하는데는 크게 문제가 없는 것으로 보이는데 평가지표도 코드에 포함되어야 채점에 큰 문제가 없을..까요..?ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제2 9분 10초 내용에 대해 질문 드립니다.
age 컬럼에서 소수점인 칼럼을 찾기 위해 df[age] != round (df[age], 0)으로 수식 작성하셨는데요. 이렇게 될 경우, 36.3은 버림이 되면서 round 적용하기 전과, 적용한 이후가 같아져서 누락이 되는거 아닌지 궁금합니다. 영상에서는 36.3 값도 필터링이 되던데 어째서 가능한지 너무 궁금합니다ㅠ 바쁘신데 감사합니다!
-
해결됨38군데 합격 비법, 2025 코딩테스트 필수 알고리즘
1-5 파이썬 max 함수를 사용하지 않는 이유
1. 현재 학습 진도몇 챕터/몇 강을 수강 중이신가요?1-5어떤 알고리즘을 학습하고 계신가요?알고리즘과 친해지기(2)여기까지 이해하신 내용은 무엇인가요?max값을 구할 때 리스트의 max 함수를 사용할 수도 있는데 굳이 max 값을 따로 구하는 이유가 있으신가요? 그게 더 시간 복잡도상으로 좋아서인지 초심자 입장에서 생각해보려고 하는 건지 궁금합니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출6회 제3유형
기출6회 제3유형 해설을보면아래 ob / ex을 어디서 구하는건가요? ob는 어떻게 구하면 될 것같은데ex는 제가 알아서 임의로 작성하면 되는건지 문의드립니다. ob = df['항암약'].value_counts().sort_index().to_list() ex = [0.1 * 20, 0.05 * 20, 0.15 * 20, 0.7 * 20] from scipy import stats stats.chisquare(ob, ex)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출8회 제3유형
문제1-2유의확률(p-value)이 0.05 미만인 유의한 변수만을 사용해 다시 로지스틱 회귀 분석을 수행하시오. 이 회귀식의 유의한 회귀 계수(상수항 포함)의 합계를 구하시오. (반올림하여 소수 셋째 자리까지 계산) 여기서 상수함 포함 이라는 문구를 보면어떻게 해설로 처리해야되는건가요? 그게 혹시model.pvalues[1:] 이렇게 표현한게 상수함 포함을 얘기하는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7회 제3유형
문제 1-2번 관련하여 유의확률 0.05미만인 유의한 변수만을 사용해 다시 로지스티고회귀분석 수행 아래 내용에 따르면 독립변수가interceptDataUsageDayMins총 3개로 보이는데 해설은DataUsageDayMins2개밖에 반영이 안되었네요 어떤게 맞는지 확인 부탁드립니다.Optimization terminated successfully. Current function value: 0.393603 Iterations 6 Logit Regression Results ============================================================================== Dep. Variable: Churn No. Observations: 1000 Model: Logit Df Residuals: 989 Method: MLE Df Model: 10 Date: Sun, 18 May 2025 Pseudo R-squ.: 0.02367 Time: 02:52:21 Log-Likelihood: -393.60 converged: True LL-Null: -403.14 Covariance Type: nonrobust LLR p-value: 0.03924 =================================================================================== coef std err z P>|z| [0.025 0.975] ----------------------------------------------------------------------------------- Intercept -2.2146 0.913 -2.425 0.015 -4.005 -0.424 AccountWeeks 0.0026 0.002 1.114 0.265 -0.002 0.007 ContractRenewal 0.1603 0.325 0.493 0.622 -0.477 0.798 DataPlan 0.2874 0.198 1.454 0.146 -0.100 0.675 DataUsage -0.1698 0.072 -2.343 0.019 -0.312 -0.028 CustServCalls 0.1374 0.074 1.858 0.063 -0.008 0.282 DayMins -0.0036 0.002 -2.092 0.036 -0.007 -0.000 DayCalls 0.0023 0.004 0.526 0.599 -0.006 0.011 MonthlyCharge 0.0042 0.005 0.778 0.436 -0.006 0.015 OverageFee -0.0127 0.036 -0.352 0.725 -0.084 0.058 RoamMins 0.0098 0.034 0.292 0.770 -0.056 0.076 =================================================================================== 8
-
미해결[PY 0203] 디버깅 기초
force run to cursor
안녕하세요! 8번째 줄에서 force run to cursor를 하면 할당이 안 보이고 바로 program finished가 되어버리는데 왜 똑같이 안 될까요?ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨인코딩 에러
기출문제 작업형2 공부하면서 라벨인코딩을을 하면 꼭 에러가 납니다. 같은 문제를 원-핫인코딩으로 해서 전후를 비교하면 데이터가 늘어난게 확인이 되는데 라벨인코딩은 에러가 나던지 데이터가 그대로 입니다.. 오타를 정확하게 확인했구요. 교재와도 정확하게 비교했는데 왜그럴까요?ㅜ그리고 원-핫인코딩은 사전에 범주형,수치형데이터 분리없이 바로 사용해도 범주형데이터만 원-핫인코딩을 진행하는게 맞는거죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
랜덤포레스트랑 XGBoost돌렸을때 선생님이 한 값이랑 다른데 상관없나요?
와 같이 선생님이 하신거랑 값이 좀 다른데 상관없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장이 가능한지 문의드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요. 작년에 결제 후 6월 시험은 강의만 후루룩 듣고 시험 보러 가니 머리가 멍 해져서 제대로 시험도 못 치루고 나왔고 12월시험 준비는 교수님 책도 사고 그랬는데... 회사 내 근무지 이동과 출장기간과 겹쳐 시험을 보지 못했습니다...ㅠ 아직 많이 부족하여 혹시 다음 달 시험 보기 전까지만 연장이 가능한 방법이 있는지 여쭈어 봅니다. 혹시나 해서 메일 주소 남겨드립니다. subinsky@naver.com 입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train데이터에서 CLIENTNUM를 drop한 후 검증데이터분리를 하셨는데
train데이터에서 CLIENTNUM를 drop한 후 검증데이터분리를 하셨는데, drop을 하고 분리한뒤에 훈련을 시키면 나중에 어떻게 최종파일 값들과 CLIENTNUM이 매칭이 되는걸까요? CLIENTNUM값을 기준으로 데이터를 기억하고 훈련시키는건 아닌건지 ㅠ이해가 잘 안되서요