묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
help, dir 사용법
안녕하세요.혹시 실제 시험 환경에서help, dir 사용하는 방법 강의는 올리실 계획이 없으실까요? 예를 들어,이번에 새로 올라온 6월 체험환경 작업형 3번 문제에서등분산인 경우,from scipy import statst_stat, p_t = stats.ttest_ind(normal, patient, equal_var = True)라는 코드가 기억이 안난다던가..실제 대응 방법을 더 자세히 알려주시면 감사할거같습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
아노바 f검정과 일원분석분석(one-way-anova)
https://www.kaggle.com/code/gggyun/t3-ttest-anova-py/edit 이 문제를 풀다가 의문이 생겨 질문드립니다. 아노바 f검정과 일원분산분석은 동의어라고 보면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회기출 3유형 1번
로지스틱 모델의 포뮬라를 만들때 자료형은 수치형이지만 범주형인 데이터(ContractRenewal, DataPlan)들이 있는거 같은데 이것들은 c로 안묶어도 되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
귀무가설,대립가설 헷갈림
3유형을 처음 공부 중입니다!코드를 짤때 귀무가설을 기준으로 코드를짜서 나오는 p-value로 판단하는 것인가요?아니면 대립가설을 기준으로 코드를 짜서 나오는 p-vlue를 기준으로 판단하는 것인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
체험환경_ 제2유형 pred 단위
체험환경에있는 칼럼설명을 보면pred는 십만원단위로 되어있는데그거 상관없이 그냥 문제풀면되나요? 아니면 별도로 설정해줘야하나요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7회 작업형3 1-3번 문제
1-3번 문제에서 예측할 때 0.5 이상일 때 1이라고 되어 있는데, 식에는 0.5 초과로 되어있어요.이상이 맞나요 초과가 맞나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막에 예측 시
계속 이런 오류가 납니다. 강의랑 모두 똑같이 작성했는데, 왜 그럴까요??
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3
새로운 데이터를 만들어서 값을 예측할 때 어떨때는 pred = model.get_prediction(new_data)를 쓰이고, 어떨 때는pred = model.predict(new_data)가 쓰이던데 둘의 차이가 뭘까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회기출문제 작업형 3번 문제 1-1번 문제 질문
주어진 데이터에서 로지스틱 회귀 분석을 수행해 유의확률(p-value)이 0.05 이상인 유의하지 않은 독립변수의 개수를 구하시오. (종속변수: Churn) 이 문제에 대한 답이 sum(model.pvalues[1:] > 0.05)이렇게 돼있는데 >이 아니라 이상이니까>=가 맞는거 아닌가용?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문있어요!
안녕하세요 선생님, 강의로 어느정도 개념정리는 됐는데 많은 문제를 풀기에는 어려울 것 같아서,시나공 빅분기 실기책만 빠르게 회독하면서 여러번 반복해서 풀어볼 예정인데괜찮은 전략이겠죠..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제9 정답: np.int32(11)
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제9 답이그냥 11이 아니고 np.int32(11)로 나오는데, 왜 그런건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8:00 영상타임에 df.groupby할때 df에 저장안하는 이유 알수있나요?
안녕하세요.df = df. groupby로 하니까 결과값이 이렇게 나와서요. 기존 해설에 되어있는대로 하면 잘 나오는 데 왜 그런건지 궁금합니다!그리고 sum에 numeric_only=True를 넣으니까 되는데 그냥 오류인가요? # your code import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") df = df.fillna(method = 'bfill') #앞의 값은 ffill #df.isnull().sum() df = df.groupby(['city','f2']).sum(numeric_only=True) #groupby한 뒤에는 df안넣기? df.head()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터분석기사 2유형 인코딩 방식 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요.2유형에서 원핫인코딩, 레이블인코딩이 있는데 보통 레이블 인코딩이 점수가 더 좋게 나오나요? 아니면 그때그때 평가지표로 확인을 해봐야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막에 평가지표로 평가점수 확인하는것
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요마지막에 metrics로 평가지표 만들어서 점수확인해보는 행위 안하고 그냥 제출해도되나요? 방법이 너무많아서 이젠 좀 헷갈리네요 ,, 만약 그렇게하려면 코드는 rf = RandomForestRegressor(random_state=0)rf.fit(train, target)# 예측 후 제출파일 생성pred = rf.predict(test)submit = pd.DataFrame({'pred': pred})submit.to_csv('result_7.csv', index=False) 이렇게 짜도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 3유형 2-2문제
데이터에서 'solar'와 'o3' 값을 고정한 상태에서, 'wind'의 세기가 증가함에 따라 'temperature'가 감소하는지를 검증하기 위해 다중 선형 회귀 분석을 수행하라고 해서 저는 ols('temperature~wind',data=df).fit()했는데 왜 이렇게 하면 안 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pop 질문
기출7(회귀)에서 아래와 같이 풀이되어있는데# 4. 데이터 전처리 # 원핫인코딩 train = pd.get_dummies(train) test = pd.get_dummies(test) # 5. 검증 데이터 분할 from sklearn.model_selection import train_test_split target = train.pop('total') X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)# 4. 데이터 전처리 # 원핫인코딩 target = train.pop('total') train = pd.get_dummies(train) test = pd.get_dummies(test) # 5. 검증 데이터 분할 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)이 방식이 더 추천되는 방식이라 이해하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3유형 체험 소문제 3번 질문입니다.
'문제에서 2번에서 구한 합동 분산 추정량을 이용하여'라고 되어 있는데, 정확하게 무슨 내용인지 이해가 안 됩니다.풀이하신 내용을 보면 독립표본검정 시 1번 그룹의 Resistin과 2번 그룹의 Resistin으로 검정을 수행하시던데.. 합동분산추정량이라면 말씀하신 공식대로 자유도와 분산을 통해 계산을 해야하는데, 1번 그룹의 Resistin과 2번 그룹의 Resistin은 자유도 반영이 안 된 것 아닌가요 ? 문제가 너무 헷갈리네요 ㅜㅜ어떻게 이해하는게 좋을까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출6회 작업형1
3번 문제를 아래와같이 풀었더니 답이 다릅니다어디가 틀린걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스와 파이썬에서 슬라이싱 차이
파이썬에서는 a:b로 슬라이싱하면, 인덱스가 a인 데이터부터 b-1인 데이터까지 출력판다스의 .loc[a:b]에서는 a부터 b까지 출력이렇게 차이가 있는 것 맞나요...??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
loc로 astype값 입력?
df.loc[:, '칼로리'] = df.loc[:, '칼로리'].astype('int') 이 코드로는 astype한 값이 입력이 안 되고, df['칼로리']로 했을 때만 입력되는 이유가 있을까요??