묻고 답해요
167만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의고사1에서 마지막에 확률을 출력해서 파일로 저장하셨는데요.
안녕하세요.작업형2 모의고사1에서 마지막에 확률을 출력해서 파일로 저장하셨는데요. 확률을 구해서 저장한 이유가 있을까요?문제에는 그런 말이 없는 것 같아서 제가 문제를 잘못 이해했을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경살펴보기 강의 내용 질문드립니다.
안녕하세요 시험환경살펴보기 강의 보면서 따라하고있는데요 글자 지우려고 할때 백스페이스가 바로 안먹고 마우스로 지우려는 글자를 드래그한다음 눌러야 지워지는데 원래이런가요?작업형1 풀이하실때 from sklearn.preprocessing import minmax_scaleminmax_scale(df['qsec'])이렇게 푸셧는데요제가 알던것과 코드가 달라서 질문합니다 아래와 같이 작성했더니 에러가 뜨는데 이렇게하면 안되나요? from sklearn.preprocessing import MinMaxScalerscaler = MinMaxScaler()df['qsec'] = scaler.fit_transform(df['qsec']) 시험환경 작업형 2 문제가 아래와같은데, 강의영상과는 달리 남자일 확률을 구해야 하는지 여자일 확률을 구해야하는지 설명이 없네요 문제가 잘못된건가요? 아니면 이렇게 나오면 어떻게 풀어야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선생님 항상 df으로 데이터를 받던데 이유가 있을까요 ?
실기 시험때도 항상 df로 데이터를 받아야 하나 해서요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험시 작업형3질문
실기 시험 응시 할 때 작업형3번에 종속변수랑 독립변수가 무엇인지 문제의 지문에서 알려주나요?ex) 종속변수 : ~~~~ 독립변수:~~~~ 그렇지 않으면 직접 찾아야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 출력값 True, False
원핫 인코딩 후 출력값이 True/False로 나오는데 1,0으로 나오는 것과 같은 건가요? 무시하고 계속 진행해도 괜찮은건지 궁금합니다!!! import pandas as pdtest = pd.read_csv("/kaggle/input/dataset/test.csv")train = pd.read_csv("/kaggle/input/dataset/train.csv")c_train = train.select_dtypes(include='O').copy()n_train = train.select_dtypes(exclude='O').copy()c_test = test.select_dtypes(include='O').copy()n_test = test.select_dtypes(exclude='O').copy() c_train = pd.get_dummies(c_train)c_test = pd.get_dummies(c_test)c_train.head()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2 RandomForest 수행시 문제
다른 모델로 했을때는 강사님께서 하신 결과와 비슷한 값으로 출력되는데 랜덤 포레스트로 했을때는 좀 값이 크게 다른거 같아서 왜 그런지 궁금합니다.r2 : 0.22820072226799604 mae : 66.05190013633266 mse : 37780.327072499626rmse : 194.37162105744662 rmsle : 0.4927575606003991 mape : 45.697109330094285이렇게 나오는데 뭐가 문제일까요?코드의 오류인줄 알고 강의자료를 복붙해서 실행해도 위의 값이 나옵니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4-1 작업형 예시 질문 있습니다
문제2주어진 데이터에서 결측치가 30%이상 되는 컬럼을 찾고 해당 컬럼에 결측치가 있는 데이터(행)를 삭제 함.그리고 30% 미만, 20% 이상인 결측치가 있는 컬럼은 최빈값으로 값을 대체하고'f3'컬럼의 'gold' 값을 가진 데이터 수를 출력하세요!문제가 지금 이런 형식인데요.제가 궁금한 것은, 결측치의 크기를 판단하는 판단하는 위치입니다.'f1' 칼럼을 dropna 하게되면 다른 행들도 영향을 받아서 결측치가 들어있는 행도 같이 날라가게 되는데각 칼럼별 결측치의 크기를 판단하는 위치는 모든 작업을 수행하기 전에 하는 것이 맞을까요? <제가 푼 코드># your codeimport pandas as pdimport numpy as nppd.set_option('display.max_columns', None)# file loadfile_path = "/content/drive/MyDrive/Colab Notebooks/빅데이터 분석기사/1. 작업형1/"df = pd.read_csv(file_path+"members.csv")check = []# find na over 30%for col in list(df.columns): check.append(df[col].isnull().sum()/len(df))for col, check in zip(list(df.columns), check): if check >= 0.3: df = df.dropna(subset=col) elif check < 0.3 and check >= 0.2: df[col] = df[col].fillna(df[col].mode()[0])print(len(df[df['f3'] == 'gold'])) <강의에서 알려준 코드># 풀이import pandas as pddf = pd.read_csv("members.csv")# print(df.isnull().sum())# print(len(df) * 0.3)# f1 삭제# f3 최빈값# print(df.shape)df = df.dropna(subset=['f1'])# print(df.shape)# print(df.head())df['f3'] = df['f3'].fillna(df['f3'].mode()[0])# print(df.head())# df.isnull().sum()print(sum(df['f3'] == 'gold'))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회기계수 질문입니다.
statsmodels를 사용한 회귀계수와 logisticregression을 사용한 회귀계수의 값이 다른데..무었을 잘못했는지 잘 모르겠습니다.. 원래 다른건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
data.atype.zip(수업노트에서 다운로드)
data_atype.zip(수업노트에서 다운로드) 라고 되어 있는데 수업노트가 어디있나요..? 찾아도 못찾겠어요.맥북 사용하고 있습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
drop을 쓸 때 하나씩만 삭제가 가능한가요?
안녕하세요! drop을 배워서 쓰고 있는데, drop은 하나씩만 삭제가 가능한가요? 여러개 삭제하려면 어떻게 해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글에 데이터셋 다운로드가 안돼요
>| 이런모양을 찾을 수 없어 결과 파일을 다운받지 못하고 있습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터프레임 drop() 함수 질문 드립니다
안녕하세요 데이터 삭제 부분 강의를 듣고 있는데요,이렇게 부분을 실행시켰을 때 <ipython-input-118-e86e4c646d42>:7: FutureWarning: In a future version of pandas all arguments of DataFrame.drop except for the argument 'labels' will be keyword-only. df=df.drop('new',1) 이런 오류가 나오는데 이유가 무엇일까요?여러번 실행시킨 것은 아니고 최초 실행 시켜도 해당 오류 메시지가 뜹니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문 있습니다!!
안녕하세요 선생님 작업형 1문제 풀다가 헷갈리는 부분이 있어서 질문 드립니다.상위, 하위 데이터를 구할 때 1번처럼 '='기호를 써서 포함을 시켜야 하나요 안 시켜야 하나요??# 하위 25% 데이터 1 . df[df['가격'] <= df['가격'].quantile(.25)] 2 . df[df['가격'] < df['가격'].quantile(.25)] # 상위 25% 데이터 1 . df[df['가격'] >= df['가격'].quantile(.75)] 2 . df[df['가격'] > df['가격'].quantile(.75)]문제에서 1행부터 400행 값을 구하라고 할 때 저는 0행이 있으니까 2번처럼 [1:401]으로 생각했는데 [:400]이 맞다고 하더라고요 어떤게 맞는건가요??1. df[:400] 2. df[1:401]
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다중회귀분석에서 범주형 변수 관련하여 질문이 있습니다.
강의 내용에서 궁금한 점이 생겼습니다. 범주형 변수를 따로 처리를 안해주더라도 ols함수는 원핫인코딩을 적용시켜서 알아서 작동한다는 것은 이해를 했습니다. 만약 변수 자체를 LabelEncoder로 value값을 변경시키고 함수에 넣어도 상관 없는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형 2번 질문 있습니다!!
선생님 안녕하세요, 예시문제 작업형 2번 문제 풀다가 궁금한 점이 있어서 질문 남깁니다.train, test 데이터를 describe 함수로 통계내 봤을 때 총 구매액와 최대 구매액에 음수 값이 있어 해당 행은 삭제하려고 합니다. 이 이후로 어떻게 진행해야 할지 몰라서 도움을 구해봅니다 ㅠㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
샘요 ㅠㅅ ㅠ?
작업형 1 문제 3에서요 조건으로 풀어주셨는데요. sum 대신 len 쓰는 건 말이 안될까요? 일단 답은 틀렸어요,,..한국말로 일대일 대응해서 코드를 적어보면, f3 컬럼에서 '실버'인 행의 갯수를 출력하려면 len을 쓸수 있지 않을까요? 그런데 값이 달라 질문드립니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
상관관계 오류
안녕하세요. 사내 구글 드라이브 접속이 불가하여주피터노트북으로 실습 진행 중인데,df.corr() 실행 시 아래와 같은 오류가 발생합니다. 찾아보니 pandas 버전에 따른 오류일 가능성이 있다는 글을 봤는데, 확인 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 분리
작업형2 에서 심장마비 확률 문제였는데요여기서 데이터 전처리를 할때 X_train.drop('id' , axis =1)X_test.pop('id)' 를 하고 데이터 분리할때 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train.drop('output', axis=1), train['output'], test_size=0.15, random_state=2022)이렇게 하신다고 했는데 위에서는 id를 드롭하고 분리할대는 'output'을 drop 하는건가요? 그리고 test는 왜 분리 하지 않는지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 3 예시문제 구 버전도 공부 해야 할까요 ?
작업형 3 구 버전도 공부해야 할까요 ? 아니면 신 버전만 공부 해도 될까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
답안 작성 관련 질문있습니다!
안녕하세요, 강의 잘 듣고 있습니다! 다름이 아니라 예전에 시험 응시 전략 강의를 듣는데 거기서'특정값 임의 대입 출력하지 말아라' 다 오답 처리 된다 라는 말씀을 하셨거든요. 그 때 이해한 게 만약 pvalue를 출력하고 싶으면 아래에서 b처럼 적지 말고 a처럼 적으라는 건가요? 설령 프린트문을 이용해서 pvalue가 0.00006인걸 확인해도요? result = stats.ttest_rel(df['bp_after'], df['bp_before'], alternative="less") print(round(result.statistic,2)) print(0.00006) 그리고 예시문제 작업형3(구버전) 강의에서 (c)번 문제 내용 중 하나가, 유의수준 0.05하에서 가설검정의 결과를 (채택/기각) 중 하나를 선택하시오. 이건데요, print('기각') 이런 게 안 된..다는거죠? 그 시험 문제에 체크하는 칸이 따로 있는 건가요? 감사합니다!