묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
가설검정 결과 채택/기각 선택
p-value가 0.0006이 나와서 대립가설을 채택하는게 맞을텐데 소문제 c는 답을 어떻게적어야하나요? '가설검정의 결과를' 채택,기각 중 골라야하는데 가설검정의 결과라는게 0.0006인거고 , 그럼 채택으로 답을 적어야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3 소문제1번
1번 문제가 잘 이해가지 않습니다.분산에 차이가 있는지 알아본다 ->등분산 검정을 수행하라는 것 같아 반사적으로 levene을 떠올리고 있었는데, 'F-검정을 수행할 때 검정통계랑을 구하라'라는 지문이 이해가지 않아요 검정 통계랑이라는게 각 분산값을 나눈것으로 정의되어 있는건가요? 저렇게 나누는것이 F-검정인가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출6회 제1유형 질문
강사님 기출6회 제1유형 3번문제에서 groupby 진행해서 월별 나누기 12하는건 알겠으나,data 확인해보니 연도별로 월별 수량이다릅니다. 근데 12로 나누면 515로 반영이되는데, 애초에 data가 안맞지 않나요? 확인해주시면 감사하겠습니다. import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/6_1/data6-1-3.csv") # df.info() # df.head() df['year'] = df['날짜'].str[:4] df = df.groupby('year')['날짜'].count() df
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출2회 작업형2
기출 2회는 한가지 방법으로 풀기(랜덤포레스트) 가 적용이 안되나용?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
아노바 f검정과 일원분석분석(one-way-anova)
https://www.kaggle.com/code/gggyun/t3-ttest-anova-py/edit 이 문제를 풀다가 의문이 생겨 질문드립니다. 아노바 f검정과 일원분산분석은 동의어라고 보면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회기출 3유형 1번
로지스틱 모델의 포뮬라를 만들때 자료형은 수치형이지만 범주형인 데이터(ContractRenewal, DataPlan)들이 있는거 같은데 이것들은 c로 안묶어도 되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
귀무가설,대립가설 헷갈림
3유형을 처음 공부 중입니다!코드를 짤때 귀무가설을 기준으로 코드를짜서 나오는 p-value로 판단하는 것인가요?아니면 대립가설을 기준으로 코드를 짜서 나오는 p-vlue를 기준으로 판단하는 것인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
체험환경_ 제2유형 pred 단위
체험환경에있는 칼럼설명을 보면pred는 십만원단위로 되어있는데그거 상관없이 그냥 문제풀면되나요? 아니면 별도로 설정해줘야하나요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7회 작업형3 1-3번 문제
1-3번 문제에서 예측할 때 0.5 이상일 때 1이라고 되어 있는데, 식에는 0.5 초과로 되어있어요.이상이 맞나요 초과가 맞나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막에 예측 시
계속 이런 오류가 납니다. 강의랑 모두 똑같이 작성했는데, 왜 그럴까요??
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3
새로운 데이터를 만들어서 값을 예측할 때 어떨때는 pred = model.get_prediction(new_data)를 쓰이고, 어떨 때는pred = model.predict(new_data)가 쓰이던데 둘의 차이가 뭘까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회기출문제 작업형 3번 문제 1-1번 문제 질문
주어진 데이터에서 로지스틱 회귀 분석을 수행해 유의확률(p-value)이 0.05 이상인 유의하지 않은 독립변수의 개수를 구하시오. (종속변수: Churn) 이 문제에 대한 답이 sum(model.pvalues[1:] > 0.05)이렇게 돼있는데 >이 아니라 이상이니까>=가 맞는거 아닌가용?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문있어요!
안녕하세요 선생님, 강의로 어느정도 개념정리는 됐는데 많은 문제를 풀기에는 어려울 것 같아서,시나공 빅분기 실기책만 빠르게 회독하면서 여러번 반복해서 풀어볼 예정인데괜찮은 전략이겠죠..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제9 정답: np.int32(11)
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제9 답이그냥 11이 아니고 np.int32(11)로 나오는데, 왜 그런건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8:00 영상타임에 df.groupby할때 df에 저장안하는 이유 알수있나요?
안녕하세요.df = df. groupby로 하니까 결과값이 이렇게 나와서요. 기존 해설에 되어있는대로 하면 잘 나오는 데 왜 그런건지 궁금합니다!그리고 sum에 numeric_only=True를 넣으니까 되는데 그냥 오류인가요? # your code import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") df = df.fillna(method = 'bfill') #앞의 값은 ffill #df.isnull().sum() df = df.groupby(['city','f2']).sum(numeric_only=True) #groupby한 뒤에는 df안넣기? df.head()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터분석기사 2유형 인코딩 방식 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요.2유형에서 원핫인코딩, 레이블인코딩이 있는데 보통 레이블 인코딩이 점수가 더 좋게 나오나요? 아니면 그때그때 평가지표로 확인을 해봐야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막에 평가지표로 평가점수 확인하는것
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요마지막에 metrics로 평가지표 만들어서 점수확인해보는 행위 안하고 그냥 제출해도되나요? 방법이 너무많아서 이젠 좀 헷갈리네요 ,, 만약 그렇게하려면 코드는 rf = RandomForestRegressor(random_state=0)rf.fit(train, target)# 예측 후 제출파일 생성pred = rf.predict(test)submit = pd.DataFrame({'pred': pred})submit.to_csv('result_7.csv', index=False) 이렇게 짜도 되나요?
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!
안녕하세요! 먼저, 강의 잘 듣고 있습니다.강의에서 설명해주신 방법대로 수업자료를 다운받았는데, 아래 파일명의 압축파일이 다운받아집니다. 00_PANDASPLOTLY_FUNCODING_FIRSTDATA상기 폴더로 업로드 해두신게 맞는지 확인 부탁드립니다. 상기 폴더에는 아래 3가지 하위폴더만 존재하며영상에서 설명해주신 python_core_summary.ipunb 파일은 존재하지 않습니다..답변 부탁드립니다. 감사합니다 :) - 강의 영상에 대한 질문이 있으시면, 상세히 문의를 작성해주시면, 주말/휴일 제외, 2~3일 내에 답변드립니다 (이외의 문의는 평생 강의이므로 양해를 부탁드립니다.)- 강의 답변이 도움이 안되셨다면, dream@fun-coding.org 로 메일 주시면 재검토하겠습니다. - 괜찮으시면 질문전에 챗GPT 와 구글 검색을 꼭 활용해보세요~- 잠깐! 인프런 서비스 운영(다운로드 방법포함) 관련 문의는 1:1 문의하기를 이용해주세요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 3유형 2-2문제
데이터에서 'solar'와 'o3' 값을 고정한 상태에서, 'wind'의 세기가 증가함에 따라 'temperature'가 감소하는지를 검증하기 위해 다중 선형 회귀 분석을 수행하라고 해서 저는 ols('temperature~wind',data=df).fit()했는데 왜 이렇게 하면 안 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pop 질문
기출7(회귀)에서 아래와 같이 풀이되어있는데# 4. 데이터 전처리 # 원핫인코딩 train = pd.get_dummies(train) test = pd.get_dummies(test) # 5. 검증 데이터 분할 from sklearn.model_selection import train_test_split target = train.pop('total') X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)# 4. 데이터 전처리 # 원핫인코딩 target = train.pop('total') train = pd.get_dummies(train) test = pd.get_dummies(test) # 5. 검증 데이터 분할 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)이 방식이 더 추천되는 방식이라 이해하면 될까요?