묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스 질문
안녕하세요강의 듣고 있는데 왕초보라 그런지.. 많이 생소하네요..ㅠ일단 한번 쭉~~~ 듣는 것이 나은 걸까요?판다스 강의 관련 질문드립니다1. 판다스에서 시리즈 만들 때 예를 들어 비빔밥, 김치찌개, 된장찌개 했으을 때, 저는맨 위에 열부분에 0이 안나오는데 상관 없나요?2. 데이터프레임 만들 때 딕셔너리값 넣을 때 들여쓰기랑 마지막줄에 })할때는 들여쓰기없이 바로 적던데 이런것들,,, 즉 들여쓰기하고 안하고 이런것도 맞춰야하는 건가요?3. 판다스에서 시리즈 데이터프레임만들고마지막 줄에 menu, price, df 도출할때print(menu), print(price)~ 처럼 print 안적어도되나요?시험장에서도 그냥 df만 적어도 실행되나요?4. df ['메뉴']랑 df[['메뉴']]가 보기에는 같은데 뭐가 다른가요?5. 항목종류, 항목별 개수 ~.value_counts할때는 print를 꼭 써야하나요?6. 인덱싱 행(가로)을 하면,, 열의 형식(세로)로 나오는건가요?7. 컬럼 추가할 때는 df['할인가'] = df['가격'] * (1-discount) 이렇게 했던 것 같은데...행 추가할때는 df.loc~~ 를 사용하는건가요? 행 추가할때 딕셔너리, loc말고 그냥 리스트 추가할때 loc안쓰고 df['~~~']= ['라떼,'아메리카노','쥬스'] 해도되나요?8. # 이벤트가 전체 1000으로 변경df.loc[1:2, '이벤트가'] = 1000df.head()여기서 1:2가 인덱스1, 인덱스2가 선택되던데,, 1:3 이렇게 적는건 아닌가요?맨 마지막은 포함안되는 것 같아서요 두서없이 질문드려 죄송합니다..좋은 강의 감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업1 강의 질문
1. 작업형1모의문제 3에서print(df['f3'].sum()) 이렇게 했더니133말고 뒤에 나오는 문장은 무슨 뜻인가요?133/tmp/ipython-input-831591789.py:13: FutureWarning: Downcasting behavior in replace is deprecated and will be removed in a future version. To retain the old behavior, explicitly call result.infer_objects(copy=False). To opt-in to the future behavior, set pd.set_option('future.no_silent_downcasting', True)df['f3'] = df['f3'].replace('vip',3) 2. df.head() 와 diplay(df.head())는 다른건가요? 3. 작업형 1 모의3 9번 문제에서df = df.groupby('month').count()df.sort_values('subscribed').index[0]하니까 저는np.int32(11) 이렇게 나오는데11앞에 이건 왜 나오는거죠? 4. 빅분기 시험 환경에서시프트 엔터 누르니까 밑에 한줄이 생성되던데.. 실행버튼을 마우스로 누르는 방법 뿐인가요? 5. 작업형1모의고사 3번 문제에서(복사가 안되네요ㅠ)실행결과값에서>smoothness error밑에 행이랑 컬럼이 쭉~~ 더 나오는데 저는 왜 이런것들이 나오는거죠?ㅠ 감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 실기 시험환경에 대한 질문입니다.
체험 사이트에서 문제풀이를 하고 답변제출로 넘어갈때 답안을 재확인 하려고 문제풀이로 다시가면 코드가 지워져있는데 실제 시험환경도 이런가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회기출 작업형2-3
예측된 이탈확률이 0.xxx 형태로 출력되던데왜 여기서 predict_proba가 아닌 predict를 이용하는지 잘 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2번 질문사항
수치형 변수 스케일링은 굳이 안해도 된다고 하셨고, 범주형 변수 처리 시, target = train.pop(' '), pd.get_dummies(train), pd.get_dummiest(test) 처리하고 분리한 데이터 다시 합침을 진행하지 않아도 되나요? 작업형 2 한가지 방법으로 풀기 영상을 봤을 땐 그랬어서 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
대응표본검정 질문
강의 3분 32초에서 alternative는 제대로 적었다는 가정 하에 after와 before의 순서를 잘못 적으면 pvalue는 같고 검정통계량의 값만 부호가 달라진다고 말씀하셨는데, 이 부분이 이상하여 질문드립니다.stats.ttest_rel(df['after'], df['before'], alternative='greater')위 상황에서 after와 before를 반대로 적으면 stats.ttest_rel(df['before'], df['after'], alternative='greater')이렇게 된다는 것일 텐데,원래 코드(위)의 대립가설은 after가 before보다 크다는 것이고, 반대로 적은 코드(아래)의 대립가설은 before가 after보다 크다는 것이니, 두 경우가 서로 정반대를 가리켜 둘의 pvalue가 정반대의 값을 나타내야 하지 않나요?둘의 pvalue가 같다는 건 두 경우의 대립가설이 모두 참이라는 것일 텐데 그럴 수가 없어보여서 궁금해서 질문 드립니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
int() / round() ? 정수로 구하라는 문제에서 선택은?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요강의 91 [작업형1] 연습문제 섹션11 ~ 20 에서 11번 문제"앞에서 구한 70% 데이터 중 ‘views’ 컬럼의 3사분위수에서 1사분위수를 뺀 값을 정수로 구하시오"이 문제에서 정수로 구하라는 부분이 헷갈립니다. int()를 써야할지 round()를 써야할지..상식적으로는 제일 가까운 값을 구해야 하기 때문에 round()를 쓸 것 같은데 해답은 int()로 코딩이 되어 있네요.다행히 이 문제는 뭘로 구하던지 답은 같은데, 이 부분 클리어하게 답변 주시면 고맙겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 기출 데이터 전처리 질문
기출2회 문제 강의에서 인코딩 전에 아래 코드로 작성하셨잖아요?그 다음 레이블인코딩에서 반복문 안에 df[col]이 아닌 왜 X_train[col]인건지 궁금해요.df = pd.concat([X_train, y_train['Reached.on.Time_Y.N']],axis=1) 위 질문에 이어, concat으로 train,test 데이터를 합친 후 레이블 인코딩 시, 범주형 자료를 추출할 때 concat을 받은 변수(예: df라면 df. select_dtypes)가 아니라 train. select_dtypes으로 다시 train을 불러오는지도 알려주세요. 미리 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의문제3번 모델&평가 부분
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요빈노트로 강의 들으면서 작성하는데 저는 결과 값이 roc_auc 기존으로 max_depth을 넣지 않거나max_depth=7을 넣을때가 가장 좋게 나옴니다. 코드명이 틀리지는 않았는데 이렇게 나올 수도 있나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train 과 test 데이터의 이상/결측치 처리 방법이 헷갈립니다.
train data에서 결측치 행은 삭제해도 되나, test data의 결측치 행은 삭제하면 안됨.train data에서 결측치 열은 삭제해도 되고, 삭제했다면 test data의 같은 열도 삭제해줘야함train data에서 결측치 행을 채워주었다면, test data의 결측치도 동일한 방법으로 채워주어야 함.근데 결측치/이상치는 처리하란 말 없으면 안해도 됨. 이게 맞는건가요..?1번은 제출 양이 같아서인건 알겠는데, 2.3번은 왜일까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[작업형1] 연습문제 섹션1 ~ 10 에서 코드(빈칸)을 클릭하면 코랩이 안 나옵니다.
[작업형1] 연습문제 섹션1 ~ 10 에서 코드(빈칸)을 클릭하면 코랩이 안 나오고ch3_ex_type1_inf_v2_blank.ipynb 이 파일이 열립니다. [작업형1] 연습문제 섹션1 ~ 10 에서 코드는 정상적으로 보입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2
실행 실패 이유가 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
11회 응시가이드 제공 여부 질의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요9, 10회 응시가이드는 있던데, 혹시 11회 응시가이드도 영상이 제공될 예정인지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RMSE값
작업형 2에서만약 회귀 문제이고 평가지표가 RMSE라면,점수를 매길때 RMSE값으로 점수를 매기는건가요?만약 그렇다면 어느정도로 차이가 나야 잘 나온건지 가늠이 안갑니다,,선생님의 답이 RMSE값이 825일때, 제가 구한값이 800~850정도라면 평가가 잘된거라고 봐도 될까요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 로지스틱 회귀 내용
section11 53번 강의 영상 - 로지스틱 회귀 관련한 공부 영상 ? 은 따로 없을까요 ? 11회 실기에서도 로지스틱 회귀 내용을 공부해야 할까요 ? 링크의 문제와 영상의 문제가 다른데 어디서 자료를 찾을 수 있나요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기시험 환경 제공 문제 풀이영상
실기 체험 환경에서 제공되는 문제의 문제풀이 영상 이 등재된 번호 좀 알려 주세요 *한국데이타산업진흥원에서 제공하는 실제 실습체험환경의 작업형1부터 작업형3까지 문제 풀이 영상이 어디에 있는지 알려 주시겟어요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의고사 2번 sum( )과 .sum()의 차이
2번 문제를 풀다가 sum을 쓰는 방법에 대해서 궁금한 점이 있어 문의 드리빈다. 저는 print((a.sum(axis=1) > 0.1).sum()) 이렇게 풀었는데, 선생님께서는 print(sum(a.sum(axis=1) > 0.1)) 이렇게 푸셨더라구요. 답은 같은데, 두 방법의 차이가 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RMSE 값이 실행할때마다 달라져요~
코드를 그대로 입력했는데, RMSE 값이 실행할 때 마다 달라지는데 이유가 있나요??RANDOMFOREST를 이용했기 때문에 그런 건가요?795~800 초반으로 번갈아서 나오네요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험에 자료를 덮어쓴 것을 처음 상태로 되돌릴 수는 없나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요자료형 1을 푸는데 df에 덮어쓴 수식이 잘못되서 시험에서 제공하는 처음 데이터 상태로 되돌릴 수는 없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분산분석 풀이 질문입니다.
분산분석을 포함하여 여러 분석이 정규성, 등분산성 등을 가정하고 있는데, 문제에서 정규성이나 등분산성에 대한 언급이 없으면 무조건 정규성과 등분산성 검정부터 해줘야 하나요? 아니면 반대로 언급이 없었으니까 안하고 바로 검정 진행하면 되나요?