묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 머신러닝 new old 질문
안녕하세요, 작업형2 머신러닝 신유형, 구유형이 있는데 신유형만 들어도 되는지, 둘 다 들어야 하는지 궁금합니다
-
미해결파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
구독 1까지 진행했는데
무료 크래딧 200달러가 안떠요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의6~7분쯤 윌콕슨 검정~ 모두다 똑같은 데이터로 작성해서 결과를 보는데 pvalue값이 다르게 나오네요 저는 ㅠ왜그런걸까요
같은 데이터프레임으로 복사해서 코드돌려보는데(지금 다시봐도 데이터프레임 값 그대로 복붙해져있고요)왜 저는 pvalue값이 다르게 나올까요 ㅠ차이가 심지어 큰거같습니다..(샤피로검정때에도 보면 결과값이 약간 차이는 있습니다)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
재수생입니다 교재가 강의보다 조금 더 어려울까요?
강의만 구매했는데 책도 구매하는게 좋을까요?책이 더 어렵나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 타이타닉-code-새 노트북 에러
필사해보려고 캐글에 타이타닉-code 새 노트북클릭하면 자꾸 에러가 뜨네요 ㅠㅠ 해결방법을 아실까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 문제 정리본 수업노트에 없어요
캐글 문제 정리본 수업노트에 없어요.올려주세요.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RMSE평가지표
5회기출문제 작업형2에서 평가지표가 RMSE가 나왔는데 다른 평가지표를 사용해도 무방하다고 하셔서 MSE로 작업을 해봤어요그런데 결과값이 너무 크게 차이가 나는데 상관없나요? 값이 작을수록 좋다고 하셔셔.. ㅜ 만약 시험에서 RMSE로 나올경우 , 대신 쓸 수 있는 평가지표를 추천해주세요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 7번 혼동
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제 7번에서 index '2001' 데이터(행)의 평균보다 큰 값의 갯수와index '2003' 데이터(행)의 평균보다 작은 값의 갯수를 더하시오위 말이 2001의 데이터행의 평균과 2001의 데이터를 비교해서 큰 값인지 df내 전체 데이터와 비교하라는 것인지 비교군이 명확하지 않아 혼동이 옵니다.설명 영상을 보고서야 같은 행에 대한 비교란 것을 알았습니다. 아래 2003도 마찬가지고요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검정 방법 질문입니다.
샤피로 검정하는 이유가 정규성을 충족하는지를 확인하기 위해 하는거라고 이해했는데 질문있습니다.만약 pvalue가 0.05보다커서정규성을 충족한다면 ttest로 하면 되나요?코드처럼 샤피로검정에서 pvalue가 0.05보다 낮으면 정규성을 충족하지 못하니 비모수검정인 윌콕슨을 하는건가요?그리고 시험에서 μd값도 기본적으로 알려주는지도 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
nunique 값이 다를 때의 인코딩
안녕하세요,시나공 책을 보니 object 컬럼의 nunique 값이 다를 때는 train, test 데이터를 concat한 뒤 원핫 인코딩을 해주어야한다고 나와있는데 레이블 인코딩도 마찬가지인가요? 모의문제 2에서는 neighbourhood의 nunique값이 다른데 concat 없이 레이블 인코딩을 진행하신 것 같아서 질문 남깁니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
그룹바이 agg 함수에서 하나의 컬럼에만 적용시키는 방법
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요# 원산지와 메뉴 기준 (평균, 합계) df.groupby(['원산지','메뉴']).agg(['mean','sum'])# 원산지와 메뉴 기준 (평균, 합계) df.groupby(['메뉴']).agg(['mean','sum'], numeric_only=True)원산지와 메뉴기준으로 agg하여 mean 과 sum을 구했을때 코드를 알려주셨는데요, 원산지 하나의 칼럼의 mean과 sum을 보고싶을 때는 어떻게 해야하나요? 에러가 나네요,, 아마 원산지가 빠져서 문자열이라 그런거같은데, numeric_only = True을 어디에 넣어야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
똑같이 튜닝 그대로 하고 했는데도 마지막에 실제 y_test로 점수를 매겨봤는데 0.796정도네요
선생님과 모든 코드와 튜닝을 똑같이 하고 가장 최종적으로 y_test로 채점해보았는데 저는 0.79대로 나오네요 ㅜ 실제 이런 점수로 나오면 시험점수에 많은 영향을 끼칠 수준인가여
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
10분56초 강의에서(랜덤포레스트 깊이 설정)
선생님과 모든 코드를 똑같이 작성하고 똑같은 데이터로 하는데 왜 저는 평가값이 모두 다를까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 6분쯤에서요 output드랍
검증데이터 분리 코드 바로 전에 output을 드랍해서 train데이터에 다시 저장하셨는데다시 또 분리할때 output컬럼을 드랍해야하는 이유가 무엇일까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
답변 제출시 평가지표 넣어야하는지 문의
from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr, y_tr) pred = rf.predict_proba(X_val) 촉박하게 공부하다 보니 평가지표에 대한 이해가 잘 되지 않는데요, 제출하는데는 크게 문제가 없는 것으로 보이는데 평가지표도 코드에 포함되어야 채점에 큰 문제가 없을..까요..?ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제2 9분 10초 내용에 대해 질문 드립니다.
age 컬럼에서 소수점인 칼럼을 찾기 위해 df[age] != round (df[age], 0)으로 수식 작성하셨는데요. 이렇게 될 경우, 36.3은 버림이 되면서 round 적용하기 전과, 적용한 이후가 같아져서 누락이 되는거 아닌지 궁금합니다. 영상에서는 36.3 값도 필터링이 되던데 어째서 가능한지 너무 궁금합니다ㅠ 바쁘신데 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출6회 제3유형
기출6회 제3유형 해설을보면아래 ob / ex을 어디서 구하는건가요? ob는 어떻게 구하면 될 것같은데ex는 제가 알아서 임의로 작성하면 되는건지 문의드립니다. ob = df['항암약'].value_counts().sort_index().to_list() ex = [0.1 * 20, 0.05 * 20, 0.15 * 20, 0.7 * 20] from scipy import stats stats.chisquare(ob, ex)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출8회 제3유형
문제1-2유의확률(p-value)이 0.05 미만인 유의한 변수만을 사용해 다시 로지스틱 회귀 분석을 수행하시오. 이 회귀식의 유의한 회귀 계수(상수항 포함)의 합계를 구하시오. (반올림하여 소수 셋째 자리까지 계산) 여기서 상수함 포함 이라는 문구를 보면어떻게 해설로 처리해야되는건가요? 그게 혹시model.pvalues[1:] 이렇게 표현한게 상수함 포함을 얘기하는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7회 제3유형
문제 1-2번 관련하여 유의확률 0.05미만인 유의한 변수만을 사용해 다시 로지스티고회귀분석 수행 아래 내용에 따르면 독립변수가interceptDataUsageDayMins총 3개로 보이는데 해설은DataUsageDayMins2개밖에 반영이 안되었네요 어떤게 맞는지 확인 부탁드립니다.Optimization terminated successfully. Current function value: 0.393603 Iterations 6 Logit Regression Results ============================================================================== Dep. Variable: Churn No. Observations: 1000 Model: Logit Df Residuals: 989 Method: MLE Df Model: 10 Date: Sun, 18 May 2025 Pseudo R-squ.: 0.02367 Time: 02:52:21 Log-Likelihood: -393.60 converged: True LL-Null: -403.14 Covariance Type: nonrobust LLR p-value: 0.03924 =================================================================================== coef std err z P>|z| [0.025 0.975] ----------------------------------------------------------------------------------- Intercept -2.2146 0.913 -2.425 0.015 -4.005 -0.424 AccountWeeks 0.0026 0.002 1.114 0.265 -0.002 0.007 ContractRenewal 0.1603 0.325 0.493 0.622 -0.477 0.798 DataPlan 0.2874 0.198 1.454 0.146 -0.100 0.675 DataUsage -0.1698 0.072 -2.343 0.019 -0.312 -0.028 CustServCalls 0.1374 0.074 1.858 0.063 -0.008 0.282 DayMins -0.0036 0.002 -2.092 0.036 -0.007 -0.000 DayCalls 0.0023 0.004 0.526 0.599 -0.006 0.011 MonthlyCharge 0.0042 0.005 0.778 0.436 -0.006 0.015 OverageFee -0.0127 0.036 -0.352 0.725 -0.084 0.058 RoamMins 0.0098 0.034 0.292 0.770 -0.056 0.076 =================================================================================== 8
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨인코딩 에러
기출문제 작업형2 공부하면서 라벨인코딩을을 하면 꼭 에러가 납니다. 같은 문제를 원-핫인코딩으로 해서 전후를 비교하면 데이터가 늘어난게 확인이 되는데 라벨인코딩은 에러가 나던지 데이터가 그대로 입니다.. 오타를 정확하게 확인했구요. 교재와도 정확하게 비교했는데 왜그럴까요?ㅜ그리고 원-핫인코딩은 사전에 범주형,수치형데이터 분리없이 바로 사용해도 범주형데이터만 원-핫인코딩을 진행하는게 맞는거죠?