묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 6회 [작업형 1 - 1번] 질문
df['출동시간'] = pd.to_datetime(df['출동시간']) df['도착시간'] = pd.to_datetime(df['도착시간']) df.info() df['걸린시간(분)'] = df['도착시간'] - df['출동시간'] df['걸린시간(분)'] = df['걸린시간(분)'].dt.total_seconds() / 60 df.head(2) result = df.groupby('소방서')['걸린시간(분)'].mean() result # 여기서 result 말고 df 에 넣으면 오류뜨는데 이유를 모르겠음. result 말고 df 넣으면 오류뜨는데 이 기준을 잘 모르겠습니다..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
책을 구매했는데요.. (시나공 2026)
빅분기 실기 강의와 같이 병행하려고 하는데어떤식으로 같이 공부하는게 효과적일지 궁금합니다..!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 질문 드립니다.
안녕하세요.작업형2 지문에 보면 문제마다 아래와 같은 평가 지표들이 있는데.여러 처리를 통해 평가지표가 높은 모델이나 처리등으로 수정을 하겠지만혹시 해당 평가지표는 꼭 구하지 않아도 되는건지 궁금합니다.즉, 해당 평가 지표는 구하지 않고 그냥 결과 파일(result.csv)만 제출하는 코드를 작성해도 되는건지요.평가 지표: RMSE (Root Mean Squared Error)평가 지표: ROC-AUC
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
레이블인코딩으로 하면 카테고리수가 달라도 문제없는걸까여?
원핫 인코딩만 하다가 지금 예시문제 작업형2를 풀다보니 ..카테고리 수가 많은건 레이블 인코딩을 해야할거같아서 해보는데 범주형컬럼에서 카테고리종류가 달라도레이블인코딩으로 하면 문제가 없는것일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문있습니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요(sklearn.metrics) 이 패키지에 RMSE, RMSLE, MAPE 등 다 추가 됐다고 말씀하셨던 것 같은데작업형2 모의문제2 에서는 직접 수식을 계산해야 한다고하셔서 혹시 어떤게 맞는건가요?패키지에 추가 됐긴했는데 시험장에선 업데이트가 안됐다고 이해하면 될까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제3 문제9
df = df.groupby(['month']).count() 이 풀이과정에서count()대신 sum()은 왜 안되는 건가요~?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다중분류 평가지표 하나의 값 선택
다중분류 평가지표(f1_score) 에서 문자인 경우 pos_label = ' ' 을 적용해서 검증 자료에 대해 평가 결과를 확인하는데, 이후 test 자료를 저장할때는 문제에서 요구하는 히나의 값을 (A,B,C 중에서 B선택) 고르는게 아니라 pred로 왜 저장해야 하는지 긍금합니다~! 다중분류 평가지표(roc_auc) 에서 0,1,2 중에서 2를 선택해야 할 경우 pred_prob( , pred[ : ,2] ) 이렇게 2를 적용해야 되는것이 맞는지 문의드립니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
cond의 여러번 사용
작업형1 모의문제3 문제7 [질문1]풀이과정에서2001행의 평균 조건을 cond로 사용하고2003행의 평균 조건도 cond로 사용하셨는데,왜 cond1, cond2 구분이 없어도 각각의 값이 출력이 되는건가용!?ㅠㅠ [질문2]df.head() df=df.T df.head() print('2001 평균:', df[2001].mean()) print('2003 평균:', df[2003].mean()) print('A :', sum(df[2001]>df[2001].mean())) print('B :', sum(df[2003]<df[2003].mean())) print('A+B :', sum(df[2001]>df[2001].mean()) + sum(df[2003]<df[2003].mean()))혼자 먼저 풀어보는 과정을 해봤는데요이전에 행/열 트랜스폼 하는 거 알려주셔서~!df.T로, 행/열 트랜스폼하구mean()으로, 각 열(컬럼)에 대해 평균 구하고sum으로, 크거나 작은 수의 개수를 구했는데.. 2001 평균: 100.7352003 평균: 97.215 A : 100 B : 102 A+B : 202 요렇게 나왔어요..loc로 풀은 내용과 왜 다를까요?ㅠ꼭 loc써야 하는 문제였을까요?!ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 기출 작업형2
EDA 과정 중에# 기초통계 train(object) train.describe(include='O') # 기초통계 test(object) test.describe(include='O')train과 test 데이터의 unique 값이 동일하다면 실제 카테고리 값 자체 비교 없이 바로 인코딩 해도 문제 없나요?카테고리 값을 비교해서 안전하게 하고 싶지만, 굳이 안 그래도 되는 거면 안 하려고 합니다!!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 강의중에
모의문제 1 풀기전에는 concat을하고 분리까지했었는데모의문제1에서 인코딩할때는 왜 concat을 안쓰고 바로 한건가요??이해가 잘 안됩니다 개념이
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 독립표본검정 / 카이제곱 적합도 검정
가설검정의 독립표본 검정과 카이제곱 적합도 검정을 서로 대체하여 사용할 수 있는지 문의드립니다! 독립표본도 서로 다른 2개의 집단 (표본)의 차이를 확인하는 것 처럼 카이제곱 적합도 또한 서로 다른 2개의 집단 (관측, 기대치)의 차이를 구하게 되는데, 그럼 이때 서로 대체하여 쓸 수 있는지 해서 여쭤봅니다!(물론 카이제곱 적합도 예제에서 독립표본 구하는 맨휘트니를 적용하니깐 값이 다르게 나오긴 합니다...^^)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 3 필수 강의
합격만 목표로 했을 때 작업형 3에서 필수로 들어야 하는 강의는 무엇인지 알려주세요 !
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요! section21강의 문의드립니다!
안녕하세요, section21.Quiz부분에 대한 해설 및 강의를 듣고싶은데 어디서 들을 수 있는지 문의드립니다! 모의문제도 아니고 모의고사도 아닌것같더라구요! ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f1 스코어는 macro옵션을 다중분류일때만 넣으면되는건가요?
f1 스코어는 macro옵션을 다중분류일때만 넣으면되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
random_state=0, random_state=123 차이가 발생합니다. 어떤값을 넣어야 하나요? 최적값이 따로 있나요?
df = pd.DataFrame({ 'f1': [2, 3, 5, 7, 11, 13, 17, 19, 23, 29], 'f2': [30, 28, 26, 24, 22, 20, 18, 16, 14, 12], 'target': ['A', 'A', 'A', 'B', 'B', 'A', 'A', 'A', 'A', 'B'] }) y_train = df.pop('target') x_tr, x_val, y_tr, y_val = train_test_split(df, y_train, test_size=0.5, random_state=123) print(x_tr.shape, x_val.shape, y_tr.shape, y_val.shape) model_rfc = RandomForestClassifier(random_state=42) model_rfc.fit(x_tr, y_tr) y_proba_val_rfc = model_rfc.predict_proba(x_val) print(y_proba_val_rfc) roc = roc_auc_score(y_val, y_proba_val_rfc[:,1]) print(roc) (5, 2) (5, 2) (5,) (5,) [[0.29 0.71] [0.92 0.08] [0.7 0.3 ] [0.74 0.26] [0.45 0.55]] 1.0 ------------------------------------------------------------------------- df = pd.DataFrame({ 'f1': [2, 3, 5, 7, 11, 13, 17, 19, 23, 29], 'f2': [30, 28, 26, 24, 22, 20, 18, 16, 14, 12], 'target': ['A', 'A', 'A', 'B', 'B', 'A', 'A', 'A', 'A', 'B'] }) target = df.pop('target') X_train, X_val, y_train, y_val = train_test_split(df, target, test_size=0.5, random_state=0) clf = RandomForestClassifier(random_state=42) clf.fit(X_train, y_train) y_pred = clf.predict_proba(X_val)[:,1] print(y_pred) # 예측값 roc_auc_score(y_val, y_pred) # 정확도 평가 [0.68 0. 0.25 0. 0.26] np.float64(0.25)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 관련해서 질문드립니다
1분내로 코드를 실행해야 한다는건 알고 있는데요, 이 부분이 시험치면서 직접적으로 어느 부분에 영향을 주나요?? 채점할때 제 코드가 1분내로 실행이 안되면 감점인건가요? 아니면 그냥 제가 문제풀때 1분이 지나면 자동으로 실행결과가 사라지는 부분이 불편한건가요?ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Data Scaling은 Skip하나요?
작업형2-3 문항의 강의를 보면 'id' 항목만 삭제하고학습/검증 Data 분리 後 바로 모델평가로 들어가는데요 수치형에 대한 Data Scaling 이 Skpi되는 이유가 뭔지 궁금해서 MinMaxScaler또는 StandardScaler를 해줘야 하는거 아닌가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
알려주신대로 캐글에서 연습하려는데 자료주소가 이상한가봐요
강의에서 알려주신대로 캐글에서 많은 연습문제를 접해보려고 하는데데이터 주소에 에러가 자꾸 뜨네요 어떻게 해야 캐글 연습을 해볼수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1, 3 풀 때 질문 있습니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 다름이 아니라 작업형 1, 3번은 답변을 적는 페이지가 따로 있는데코드 적는 풀이도 채점을 받게 되는 건가요? 강의에서 보면 중간 print들은 지워주라는 말씀을 몇 번 하셨는데꼭 답변 부분만 print로 출력해야 하는지,중간 과정은 출력하면 안되는지,또 혹시라도 답변 부분을 print로 확인 후 주석 처리 시 감점 요인인지 궁금합니다. 저는 제출한 답안만 평가 대상이라고 생각했는데 저의 풀이과정 코드도 평가 대상일까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 8회 3유형 문제 1-3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요강의가 누락된거같은데 어디서 볼 수 있을까요?