묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
귀무가설,대립가설 헷갈림
3유형을 처음 공부 중입니다!코드를 짤때 귀무가설을 기준으로 코드를짜서 나오는 p-value로 판단하는 것인가요?아니면 대립가설을 기준으로 코드를 짜서 나오는 p-vlue를 기준으로 판단하는 것인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
체험환경_ 제2유형 pred 단위
체험환경에있는 칼럼설명을 보면pred는 십만원단위로 되어있는데그거 상관없이 그냥 문제풀면되나요? 아니면 별도로 설정해줘야하나요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7회 작업형3 1-3번 문제
1-3번 문제에서 예측할 때 0.5 이상일 때 1이라고 되어 있는데, 식에는 0.5 초과로 되어있어요.이상이 맞나요 초과가 맞나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막에 예측 시
계속 이런 오류가 납니다. 강의랑 모두 똑같이 작성했는데, 왜 그럴까요??
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3
새로운 데이터를 만들어서 값을 예측할 때 어떨때는 pred = model.get_prediction(new_data)를 쓰이고, 어떨 때는pred = model.predict(new_data)가 쓰이던데 둘의 차이가 뭘까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회기출문제 작업형 3번 문제 1-1번 문제 질문
주어진 데이터에서 로지스틱 회귀 분석을 수행해 유의확률(p-value)이 0.05 이상인 유의하지 않은 독립변수의 개수를 구하시오. (종속변수: Churn) 이 문제에 대한 답이 sum(model.pvalues[1:] > 0.05)이렇게 돼있는데 >이 아니라 이상이니까>=가 맞는거 아닌가용?
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
float64 null 값 처리 방법
코랩에서 house_df.fillna(house_df.mean(), inplace=True)를 실행하였는데 에러가 나서 커뮤니티를 보니# object가 아닌 number 타입을 별도 리스트로 추출 num_columns=house_df.dtypes[house_df.dtypes!='object'].index.to_list() # Drop 하지 않는 number 타입 컬럼들에 대해서 Null컬럼들은 평균값으로 대체 house_df[num_columns].fillna(house_df[num_columns].mean(),inplace=True)이렇게 코드를 변경하여 실행해보라고 하여 실행하였습니다.그런데, # Null 값이 있는 피처명과 타입을 추출 null_column_count = house_df.isnull().sum()[house_df.isnull().sum() > 0] print('## Null 피처의 Type :\n', house_df.dtypes[null_column_count.index])이 코드를 실행하니 Null 피처의 Type 중에서 float64 컬럼들은 null값이 제대로 처리가 안된 걸 알 수 있었습니다. 어떻게 해결할 수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문있어요!
안녕하세요 선생님, 강의로 어느정도 개념정리는 됐는데 많은 문제를 풀기에는 어려울 것 같아서,시나공 빅분기 실기책만 빠르게 회독하면서 여러번 반복해서 풀어볼 예정인데괜찮은 전략이겠죠..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제9 정답: np.int32(11)
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제9 답이그냥 11이 아니고 np.int32(11)로 나오는데, 왜 그런건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8:00 영상타임에 df.groupby할때 df에 저장안하는 이유 알수있나요?
안녕하세요.df = df. groupby로 하니까 결과값이 이렇게 나와서요. 기존 해설에 되어있는대로 하면 잘 나오는 데 왜 그런건지 궁금합니다!그리고 sum에 numeric_only=True를 넣으니까 되는데 그냥 오류인가요? # your code import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") df = df.fillna(method = 'bfill') #앞의 값은 ffill #df.isnull().sum() df = df.groupby(['city','f2']).sum(numeric_only=True) #groupby한 뒤에는 df안넣기? df.head()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터분석기사 2유형 인코딩 방식 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요.2유형에서 원핫인코딩, 레이블인코딩이 있는데 보통 레이블 인코딩이 점수가 더 좋게 나오나요? 아니면 그때그때 평가지표로 확인을 해봐야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막에 평가지표로 평가점수 확인하는것
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요마지막에 metrics로 평가지표 만들어서 점수확인해보는 행위 안하고 그냥 제출해도되나요? 방법이 너무많아서 이젠 좀 헷갈리네요 ,, 만약 그렇게하려면 코드는 rf = RandomForestRegressor(random_state=0)rf.fit(train, target)# 예측 후 제출파일 생성pred = rf.predict(test)submit = pd.DataFrame({'pred': pred})submit.to_csv('result_7.csv', index=False) 이렇게 짜도 되나요?
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!
안녕하세요! 먼저, 강의 잘 듣고 있습니다.강의에서 설명해주신 방법대로 수업자료를 다운받았는데, 아래 파일명의 압축파일이 다운받아집니다. 00_PANDASPLOTLY_FUNCODING_FIRSTDATA상기 폴더로 업로드 해두신게 맞는지 확인 부탁드립니다. 상기 폴더에는 아래 3가지 하위폴더만 존재하며영상에서 설명해주신 python_core_summary.ipunb 파일은 존재하지 않습니다..답변 부탁드립니다. 감사합니다 :) - 강의 영상에 대한 질문이 있으시면, 상세히 문의를 작성해주시면, 주말/휴일 제외, 2~3일 내에 답변드립니다 (이외의 문의는 평생 강의이므로 양해를 부탁드립니다.)- 강의 답변이 도움이 안되셨다면, dream@fun-coding.org 로 메일 주시면 재검토하겠습니다. - 괜찮으시면 질문전에 챗GPT 와 구글 검색을 꼭 활용해보세요~- 잠깐! 인프런 서비스 운영(다운로드 방법포함) 관련 문의는 1:1 문의하기를 이용해주세요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 3유형 2-2문제
데이터에서 'solar'와 'o3' 값을 고정한 상태에서, 'wind'의 세기가 증가함에 따라 'temperature'가 감소하는지를 검증하기 위해 다중 선형 회귀 분석을 수행하라고 해서 저는 ols('temperature~wind',data=df).fit()했는데 왜 이렇게 하면 안 되나요?
-
해결됨단 60분! 파이썬 핵심 개념 초압축 강의 - 이론보다 이해 중심
colab 프로그램 설정 관련 안내
colab 프로그램 설정 관련 안내는 어디서 확인하면 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pop 질문
기출7(회귀)에서 아래와 같이 풀이되어있는데# 4. 데이터 전처리 # 원핫인코딩 train = pd.get_dummies(train) test = pd.get_dummies(test) # 5. 검증 데이터 분할 from sklearn.model_selection import train_test_split target = train.pop('total') X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)# 4. 데이터 전처리 # 원핫인코딩 target = train.pop('total') train = pd.get_dummies(train) test = pd.get_dummies(test) # 5. 검증 데이터 분할 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)이 방식이 더 추천되는 방식이라 이해하면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3유형 체험 소문제 3번 질문입니다.
'문제에서 2번에서 구한 합동 분산 추정량을 이용하여'라고 되어 있는데, 정확하게 무슨 내용인지 이해가 안 됩니다.풀이하신 내용을 보면 독립표본검정 시 1번 그룹의 Resistin과 2번 그룹의 Resistin으로 검정을 수행하시던데.. 합동분산추정량이라면 말씀하신 공식대로 자유도와 분산을 통해 계산을 해야하는데, 1번 그룹의 Resistin과 2번 그룹의 Resistin은 자유도 반영이 안 된 것 아닌가요 ? 문제가 너무 헷갈리네요 ㅜㅜ어떻게 이해하는게 좋을까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출6회 작업형1
3번 문제를 아래와같이 풀었더니 답이 다릅니다어디가 틀린걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스와 파이썬에서 슬라이싱 차이
파이썬에서는 a:b로 슬라이싱하면, 인덱스가 a인 데이터부터 b-1인 데이터까지 출력판다스의 .loc[a:b]에서는 a부터 b까지 출력이렇게 차이가 있는 것 맞나요...??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
loc로 astype값 입력?
df.loc[:, '칼로리'] = df.loc[:, '칼로리'].astype('int') 이 코드로는 astype한 값이 입력이 안 되고, df['칼로리']로 했을 때만 입력되는 이유가 있을까요??