묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
대응표본검정 질문
강의 3분 32초에서 alternative는 제대로 적었다는 가정 하에 after와 before의 순서를 잘못 적으면 pvalue는 같고 검정통계량의 값만 부호가 달라진다고 말씀하셨는데, 이 부분이 이상하여 질문드립니다.stats.ttest_rel(df['after'], df['before'], alternative='greater')위 상황에서 after와 before를 반대로 적으면 stats.ttest_rel(df['before'], df['after'], alternative='greater')이렇게 된다는 것일 텐데,원래 코드(위)의 대립가설은 after가 before보다 크다는 것이고, 반대로 적은 코드(아래)의 대립가설은 before가 after보다 크다는 것이니, 두 경우가 서로 정반대를 가리켜 둘의 pvalue가 정반대의 값을 나타내야 하지 않나요?둘의 pvalue가 같다는 건 두 경우의 대립가설이 모두 참이라는 것일 텐데 그럴 수가 없어보여서 궁금해서 질문 드립니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
int() / round() ? 정수로 구하라는 문제에서 선택은?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요강의 91 [작업형1] 연습문제 섹션11 ~ 20 에서 11번 문제"앞에서 구한 70% 데이터 중 ‘views’ 컬럼의 3사분위수에서 1사분위수를 뺀 값을 정수로 구하시오"이 문제에서 정수로 구하라는 부분이 헷갈립니다. int()를 써야할지 round()를 써야할지..상식적으로는 제일 가까운 값을 구해야 하기 때문에 round()를 쓸 것 같은데 해답은 int()로 코딩이 되어 있네요.다행히 이 문제는 뭘로 구하던지 답은 같은데, 이 부분 클리어하게 답변 주시면 고맙겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 기출 데이터 전처리 질문
기출2회 문제 강의에서 인코딩 전에 아래 코드로 작성하셨잖아요?그 다음 레이블인코딩에서 반복문 안에 df[col]이 아닌 왜 X_train[col]인건지 궁금해요.df = pd.concat([X_train, y_train['Reached.on.Time_Y.N']],axis=1) 위 질문에 이어, concat으로 train,test 데이터를 합친 후 레이블 인코딩 시, 범주형 자료를 추출할 때 concat을 받은 변수(예: df라면 df. select_dtypes)가 아니라 train. select_dtypes으로 다시 train을 불러오는지도 알려주세요. 미리 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의문제3번 모델&평가 부분
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요빈노트로 강의 들으면서 작성하는데 저는 결과 값이 roc_auc 기존으로 max_depth을 넣지 않거나max_depth=7을 넣을때가 가장 좋게 나옴니다. 코드명이 틀리지는 않았는데 이렇게 나올 수도 있나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train 과 test 데이터의 이상/결측치 처리 방법이 헷갈립니다.
train data에서 결측치 행은 삭제해도 되나, test data의 결측치 행은 삭제하면 안됨.train data에서 결측치 열은 삭제해도 되고, 삭제했다면 test data의 같은 열도 삭제해줘야함train data에서 결측치 행을 채워주었다면, test data의 결측치도 동일한 방법으로 채워주어야 함.근데 결측치/이상치는 처리하란 말 없으면 안해도 됨. 이게 맞는건가요..?1번은 제출 양이 같아서인건 알겠는데, 2.3번은 왜일까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[작업형1] 연습문제 섹션1 ~ 10 에서 코드(빈칸)을 클릭하면 코랩이 안 나옵니다.
[작업형1] 연습문제 섹션1 ~ 10 에서 코드(빈칸)을 클릭하면 코랩이 안 나오고ch3_ex_type1_inf_v2_blank.ipynb 이 파일이 열립니다. [작업형1] 연습문제 섹션1 ~ 10 에서 코드는 정상적으로 보입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2
실행 실패 이유가 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
11회 응시가이드 제공 여부 질의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요9, 10회 응시가이드는 있던데, 혹시 11회 응시가이드도 영상이 제공될 예정인지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RMSE값
작업형 2에서만약 회귀 문제이고 평가지표가 RMSE라면,점수를 매길때 RMSE값으로 점수를 매기는건가요?만약 그렇다면 어느정도로 차이가 나야 잘 나온건지 가늠이 안갑니다,,선생님의 답이 RMSE값이 825일때, 제가 구한값이 800~850정도라면 평가가 잘된거라고 봐도 될까요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 로지스틱 회귀 내용
section11 53번 강의 영상 - 로지스틱 회귀 관련한 공부 영상 ? 은 따로 없을까요 ? 11회 실기에서도 로지스틱 회귀 내용을 공부해야 할까요 ? 링크의 문제와 영상의 문제가 다른데 어디서 자료를 찾을 수 있나요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기시험 환경 제공 문제 풀이영상
실기 체험 환경에서 제공되는 문제의 문제풀이 영상 이 등재된 번호 좀 알려 주세요 *한국데이타산업진흥원에서 제공하는 실제 실습체험환경의 작업형1부터 작업형3까지 문제 풀이 영상이 어디에 있는지 알려 주시겟어요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의고사 2번 sum( )과 .sum()의 차이
2번 문제를 풀다가 sum을 쓰는 방법에 대해서 궁금한 점이 있어 문의 드리빈다. 저는 print((a.sum(axis=1) > 0.1).sum()) 이렇게 풀었는데, 선생님께서는 print(sum(a.sum(axis=1) > 0.1)) 이렇게 푸셨더라구요. 답은 같은데, 두 방법의 차이가 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RMSE 값이 실행할때마다 달라져요~
코드를 그대로 입력했는데, RMSE 값이 실행할 때 마다 달라지는데 이유가 있나요??RANDOMFOREST를 이용했기 때문에 그런 건가요?795~800 초반으로 번갈아서 나오네요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험에 자료를 덮어쓴 것을 처음 상태로 되돌릴 수는 없나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요자료형 1을 푸는데 df에 덮어쓴 수식이 잘못되서 시험에서 제공하는 처음 데이터 상태로 되돌릴 수는 없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분산분석 풀이 질문입니다.
분산분석을 포함하여 여러 분석이 정규성, 등분산성 등을 가정하고 있는데, 문제에서 정규성이나 등분산성에 대한 언급이 없으면 무조건 정규성과 등분산성 검정부터 해줘야 하나요? 아니면 반대로 언급이 없었으니까 안하고 바로 검정 진행하면 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
46강 다중선형회귀2(범주형변수) 질문합니다.
두 가지 질문이 있습니다.1. 아래 코딩부분 강의에서는 유형별로 0,1 로 나오는데 제꺼는 true, false 로 나옵니다. 문제 없는건가요? 왜 다르게 나오는지 알고싶습니다.#원핫인코딩df2 = pd.get_dummies(df)df2.head() model.summary 했을 때 나오지 않은 유형(강의에서는A)를 drop하면 되는건가요? 전부 다 나온다고 하면... 어떤 기준으로 드롭해야할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출2회 작업형1 문제2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요!기출2회 작업형1 2번문제 문의드립니다.std1과 std2가 같게 나왔는데,한번에 돌리다보니 덮어써진 것 같습니다.질문들을 찾아보니 코드를 다시 쓰면 된다고 답변을 다셨던데, 어디에 어떤 코드를 쓰면 될까요?그리고 처음 std1을 찾을 때도 강의와는 다른 값이 나오던데, 이거는 이유가 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2번문제
import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/5_1/5-2bmi.csv") # your code df['bmi']=df['Weight']/(df['Height']*df['Height'])*10000 df['위험']=(df['bmi'] >=23) & (df['bmi']<25) df['정상']=(df['bmi'] >=18.5) & (df['bmi']<23) print(sum(df['위험']),sum(df['정상'])) 저는 코드를 이렇게 짰는데,, 위험이 2129명이라고 나오는데 선생님이 올려주신 정답지는 2130명이더라구요 ㅠ왜다를까요? 2. bmi를 계산하고, 수치가 정상인 사람 수와 위험체중인 사람 수의 차이를 절대값으로 구하시오 (정수로 출력) - bmi(체질량지수): 몸무게(kg) / 키(m)의 제곱 단위 - Height: cm - Weight: kg - 저체중: BMI 18.5미만 - 정상체중: BMI 18.5이상 ~ 23미만 - 과체중 또는 위험체중: BMI 23 이상 ~ 25미만 - 비만체중: 25이상
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
주석관련
강사님 덕에 아무것도 몰랐던 파이선에 대해서 알고 빅분기 실기 준비 원활하게 잘 하고 있습니다.주석처리 관련해서 Ctrl+/로 하는 걸로 아는데요.. 코랩이나 실기체험 프로그램에서 처음엔 잘 되다가 몇 분 지나면 안되는데, 왜 그럴까요.. 안되니까 너무 답답하네요...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 작업형2 코딩방법
저는 문제를 보고 9회차의 작업형2 방식과 동일하게 아래와 같이 했는데요이렇게 해도 되나요?drop와 레이블인코딩을 하지 않았을때값이 10정도 차이가 나서 질문 드립니다! # 라이브러리 및 데이터 불러오기import pandas as pdtrain = pd.read_csv("churn_train.csv")test = pd.read_csv("churn_test.csv") target = train.pop('TotalCharges') train = pd.get_dummies(train)test = pd.get_dummies(test) from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0) #랜덤포레스트from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegressor(random_state=0)rf.fit(X_tr, y_tr)pred = rf.predict(X_val) from sklearn.metrics import mean_absolute_errorprint(mean_absolute_error(y_val, pred)) # LightGBMimport lightgbm as lgblg = lgb.LGBMRegressor(random_state=0, verbose=-1)lg.fit(X_tr, y_tr)pred = lg.predict(X_val)print(mean_absolute_error(y_val, pred))