묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1, 3 풀 때 질문 있습니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 다름이 아니라 작업형 1, 3번은 답변을 적는 페이지가 따로 있는데코드 적는 풀이도 채점을 받게 되는 건가요? 강의에서 보면 중간 print들은 지워주라는 말씀을 몇 번 하셨는데꼭 답변 부분만 print로 출력해야 하는지,중간 과정은 출력하면 안되는지,또 혹시라도 답변 부분을 print로 확인 후 주석 처리 시 감점 요인인지 궁금합니다. 저는 제출한 답안만 평가 대상이라고 생각했는데 저의 풀이과정 코드도 평가 대상일까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 8회 3유형 문제 1-3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요강의가 누락된거같은데 어디서 볼 수 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3 (신버전) 질문입니다.
예시문제 작업형3 (신버전) 문제의 제공된 데이터에서로지스틱 회귀 모델 생성시 C()로 묶어서 처리해야하는 데이터는Survived, Pdass, Gender, Embarked 뿐인게 맞나요??문제에는 Gender밖에 사용되지 않았지만 만약 위의 변수들도 포함해서 회귀 모형을 만들라는 지시가 있었을때 C()로 묶는게 맞는지 여쭤봅니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형변수 인코딩
범주형 변수에 대해 라벨인코딩만 하시는데pd.get_dummies로 그냥 원핫인코딩 하면 안되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터 분석기사 실기 체험 환경 질문입니다.
작업형 1, 3과 같이 문제를 풀이하는 칸과 답안을 제출하는 칸이 다르게 있는 경우 문제 풀이에서 답안 제출 칸으로 넘어가면 문제 풀이칸에서 적어놨던 코드들이 날아가더라구요.. 메모장도 문제풀이에서 적어놨던 내용이 답안 제출 칸으로 넘어가게 되면 리셋되는 것 같아서 이 경우 소문제의 답을 모두 외우고 답안 제출 칸으로 넘어가야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
삭제예정인 23섹션은 공부하지 않아도 되나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 질문
문제에 제시해주신 데이터를 보면, education_level, marital_status 컬럼에서 unknown이 확인되는데, 실제 시험에서 이런 값은 결측치로 간주하지 않아도 되는걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시나공 교재도 구입해서 ..일단 홈페이지 자료실에서 다운받았는데
시나공 교재도 구입해서 ..일단 홈페이지 자료실에서 다운받았는데폴더를 다운받았어요 근데 봐도 어떻게 자료를 열어서 작업하는지 전혀 모르겠네요선생님 구글랩 링크를 알려주시면 거기에 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩, 라벨인코딩 중 하나 결정해야할때
안녕하세요. 범주형 변수 인코딩시 원핫인코딩 또는 라벨인코딩을 활용하게 되어있는데 둘중 아무거나 활용해도 상관이 없나요? 아니면 범주의 숫자가 너무 많을 때는 라벨인코딩을 하는 것이 더 성능에 좋은가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7회-작업형2에서 random_state = 0 과 42 차이에 대한 질문
7회기출 풀면서,랜덤포레스트회귀로 풀었는데. R2값이 마이너스라고 놀랐고. 아래는 random_state 설정별 결과값인데, 0이 더 좋은 결과를 낸 것이라고 보면 되는건가요?(R2값을 구글 제미나이에 물어보니, 심각한 문제라고 설명해주긴 하는데. 무시해도 되는건지..)random_state=0 으로 하면.R2값 : -0.10286RMSE : 385,935 이고. random_state=42으로 하면.R2값 : -0.05894RMSE : 400,843 입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제1
작업형2 모의문제1 풀이중08:04 #baselinecols = train.select_dtypes(include='object').columnscolstrain = train.drop(cols, axis=1)test = test.drop(cols, axis=1) print(train.info(),test.info())위와 같이 실행을 하면 test 데이터의 object 칼럼은 삭제가 안된것 같아보여서요아래와 같이 추가로 한줄 더 안써도 되는건가요??cols = test.select_dtypes(include='object').columns
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
대응표본검정 강의 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요대응표본검정 심화 부분# Shapiro-Wilk(샤피로-윌크) 정규성 검정 df['diff'] = df['after'] - df['before'] from scipy import stats stats.shapiro(df['diff']) # Wilcoxon(윌콕슨)의 부호 순위 검정 수행 stats.wilcoxon(df['after'], df['before'], alternative = 'greater') 결과 : WilcoxonResult(statistic=np.float64(47.5), pvalue=np.float64(0.017578125)) 강의와 p-value값이 차이가 있는데 잘못된 부분이 있을까요?(강의 p-value 값 : 0.024410625)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
iloc 사용시
교재 92페이지df.iloc[1:3, '메뉴' : '칼로리']df.loc[2:3, '메뉴' : '칼로리'] loc는 실행되고, iloc는 '메뉴':'칼로리'에서 에러나는데 이유가 있을까용?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 인코딩
섹션5. 28, 29 번 강의 중 궁금한 것이 생겨 질문 드립니다. 왜 28(분류) 에서는 train 데이터와 test 데이터를 각각 인코딩하고29 (회귀) 에서는 train 데이터와 test 데이터를 합친 후, 인코딩하고 다시 분리하는지 궁금합니다.
-
미해결파이썬 기초 라이브러리부터 쌓아가는 머신러닝
kaggle data 분석 강의에 사용된 data file이 없읍니다.
kaggle data 소개 및 분석에서 실습에 사용되는 train.csv와 test.csv가 블로그에서 알려준 구글 공유 폴더에 들어가도 전혀 보이지가 않습니다. 강의 이후에 삭제된 것 같은데요, Kaggle의 어느 자료인지 알려주시면 kaggle에서 직접 찾아 보도록 하겠읍니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 질문
트레인과 테스트의 범주형 데이터가 다를 수 있어서 그냥 처음부터 두 데이터를 합쳐서 레이블이나 원-핫인코딩을 하려고 합니다1.레이블인코딩시df=pd.concat([train,test]) 후cols=df.select_dtypes(include='O').colunms 로 가능한가요? 그리고 합쳐진 데이터니까 df[col]=le.fit_transfom(df[col])만 해주면 되는거죠? 어차피 두 데이터를 합쳐서 할 경우 set함수사용은 불필요한거죠?f1스코어를 사용할경우,average꼭 넣어주어야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2, 모의고사1
작업형2, 모의고사1target : Attrition_Flag (1:이탈, 0:유지)일경우 roc_auc_scored사용시 예측값으로 pred[:,1]했는데 확률값으로 무조건 1열을 정답으로제출하면 되나요? 1:이탈이라는 뜻은 1열이 이탈이라는 뜻인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
28강 17:55 질문있습니다
pred[ : ,1]을 하는 이유는 이해가 되는데 iloc를 안써도 되는건가요? pred[ : ,1] 와 pred.iloc[ : ,1] 은 쓰임새가 다른건지 궁금합니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[:,1] 콤마가 이해가 안됩니다.
from sklearn.metrics import roc_auc_score roc_auc=roc_auc_score(y_val, pred[:,1]) #y_yal=검증데이터의 정답 print('roc_auc: ',roc_auc) 에서 >50K 값만 넣으라고 했으니 리스트로 치면 1번째에 있는건 알겠는데(['<=50K' '>50K'] 로 되기때문) pred[:,1]에서 콤마가 뭐 때문에 쓰이는지 이해가 되지 않습니다..!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의연장 요청드립니다
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요작년에 빅데이터 시험 상반기는 접수해놓고 보러가지 못했고 하반기 시험은 떨어졌습니다ㅜ이번 실기는 꼭 붙고 싶습니다!강의가 이틀 뒤 만료인데 혹시 시험 전날인 20일까지 연장이 가능할지 여쭤봅니다..제 메일 주소는 blue6143@naver.com 입니다!