묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
교제와 인강
빅데이터분석기사 교제 158p~209p 까지의 내용은 무슨 강의를 들으면 되는건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 기출유형 작업형 3
8:20 이후 문제 1-3을 할 차례인데 하지 않고 2-1문제로 강의가 넘어갑니다. 1-3 문제는 어디서 다루나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험볼 때 자료 재활용 방법
아래와 같이 기출2번 제1유형에서 제가 df = df.iloc[ ~ 막 작성하면서 자료가 한번 망가졌는데, 지금이야, 다시 파일로드해서 공부하면되지만시험장에서 자료만들다가 dt가 망가지면 어떻게 복구할 수 있나요? 다시 처음부터 할 수 있는지 방법 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
정답에 int ~~
학습 관련 질문을ㅇ 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 퇴근후딴짓님.마지막 답이 이런식으로 나오는 그대로 제출해도 되나요?? 퇴근후 딴짓님 코드 그대로 입력햇는데 아래 처럼 나오는데요.앞에 int()로 묶어도 점수에 영향이 없나요?? 아니면 아래 그래도 제출해도 되나요??np.int64(313)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출6회 제2유형 질문
기출6회 제2유형 질문 해설보니아래 내용중에서해설 : pred = rf.predict(x_val)제답안 : pred = rf.predict(test) 위 내용이 다른데 어차피 제출할때 써야하는 내용이므로 test로 진행해야되지않을까요? 어떤게 답인지몰라문의드립니다.# 랜덤포레스트 from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr, y_tr) pred = rf.predict(X_val) f1_score(y_val, pred, average='macro')
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오징어게임 온보딩 관련 문의
안녕하세요.온보딩 기간: 4월 28일 ~ 5월 9일온보딩 기간 중 파이썬과 판다스를 미리 학습 부탁드립니다. 스터디에서는 문제 풀이 참여 중심으로 진행 예정입니다.오징어게임 관련해서 이런 안내가 있는데전체 강의 중 최소한 ‘섹션3. [작업형1] 판다스’까지는 학습 완료해야 한다고 이해하면 될까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제3
작업형2 모의문제3에서 xgb모델을 사용할 때 max_depth 기본 설정이 3으로 되어 있어서 max_depth=3을 코드에 넣었을 때와 넣지 않았을 때가 값이 똑같아야 한다고 설명해주셨는데 저는 값이 다르게 나와요. 왜 다르게 나올까요..그리고 머신러닝 강의를 따라하다보면 결과 값이 종종 영상과 다르게 나오는 경우가 있는데 코드를 똑같이 작성해도 값이 다를 수 있나요?from xgboost import XGBClassifier xgb=XGBClassifier(random_state=2022) xgb.fit(X_tr,y_tr) pred=xgb.predict(X_val) pred_proba=xgb.predict_proba(X_val) print(roc_auc_score(y_val, pred_proba[:,1])) print(f1_score(y_val, pred)) print(accuracy_score(y_val, pred)) ->0.9192546583850931 0.8444444444444444 0.8108108108108109 from xgboost import XGBClassifier xgb=XGBClassifier(random_state=2022, max_depth=3) xgb.fit(X_tr,y_tr) pred=xgb.predict(X_val) pred_proba=xgb.predict_proba(X_val) print(roc_auc_score(y_val, pred_proba[:,1])) print(f1_score(y_val, pred)) print(accuracy_score(y_val, pred))->0.8975155279503105 0.8444444444444444 0.8108108108108109
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
피처엔지니어링 13.00초 부분 질문이 있습니다.
for col in cols le = labelencoder()C_Train[col] = le.fit_transform(C_train[col]) 여기에서요. col 이라는 피처는 for col 반복문 에서 처음 생겼는데 C_train[col] 변수에 담을 transform(c_train[col])의 피처 col은 어디서 생겨난지 모르겟어서요.. 반복문 처음에 col로 피처를 생성한거를 c_train[col]이라고 명시하는 순간 col 칼럼이 생기면서 그 값을 알아서 가져오는 건가요???
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
원래 원핫인코딩은 범주형 변수에만 적용가능하지 않나요? 강사님께서는 굳이 수치형과 범주형을 나누지 않고 train = pd.get_dummies(train), test = pd.get_dummies(test)하셨는데 이렇게 굳이 나누지 않고 원핫인코딩을 적용해도 괜찮나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4-3 작업형1 모의문제3의 문제7번 문의드립니다
df = pd.read_csv("data.csv", index_col="Unnamed: 0")# your codedf=df.T df.head() #print(df[2001].mean()) a=sum(df[2001]>df[2001].mean()) #print(df[2003].mean()) b=sum(df[2003]<df[2003].mean()) print(a+b) 이렇게 풀어도 괜찮은걸까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 기출 작업형3 1번문제
1번문제는 범주형 데이터 분석이라고 하셨는데 어떻게 구분하나요? 저는 처음에 이 문제가 두 집단이 있어 독립표본 검정을 사용해야겠다라고 생각했습니다.
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
구글코랩 실행이 안되서요
-강의 내용이나 궁금증이 있으시면 질문해 주세요!구글코랩 파일 업로드 안되네요. 그리고 검정 창이 아니라 ...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 자료 업로드 문의
안녕하세요 강사님, 강의 잘 듣고 있습니다.혹시 슬라이드 형태로 공유 주시는 자료를 별도 pdf나 파일로 업로드 해주실 수 있으실지 문의드립니다.e.g.) 섹션 5. [작업형2] 머신러닝 및 평가지표 -머신러닝 프로세스 매번 일부 슬라이드를 스크린샷 해서 보고 있어 살짝 불편합니다.혹시 가능할지 확인해주시면 감사하겠습니다 :)
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제1
이탈할 고객의 확률이기 때문에 인덱스가 1인 컬럼을 선택해야해서 pred[:,1] 를 쓴다고 하셨는데,이탈할 고객의 확률의 인덱스가 1인지 어떻게 아나요..?# roc-auc pred = model.predict_proba(X_val) print(roc_auc_score(y_val, pred[:,1]))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요 선생님
제가 일단 판다스기본 보고있는데.. 코드가 원리같은건 이해를 하겠는데 직접 타이핑할때 아직 세세하게 기억이 나질않아서 꼭 답을 보면 생각나더라구요.. 괄호 사용이나 메서드 사용법같은.. 현재 제 상태면 판다스 기본만 일단 계속 봐야하나요? 아니면 진도를 계속 나가도 되나요..? 이게 진도를 나가면서 문제통해서 배우는건지 판다스기본 완벽하게 마스터하고 나가야하는지 모르겠습니다 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 데이터 불러올때
type 확인 후 cols = ['age', 'fnlwgt', 'education.num', 'capital.gain', 'capital.loss', 'hours.per.week']이렇게 수치형 데이터의 열만 복사하는 거 말고 cols = X_train.select_dtypes(exclude='object').copy()를 사용해도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링, 인코딩 등 데이터 작업후에
스케일링, 인코딩 등 데이터 작업후에 위로 올라가서 다시 실행하면 처음이라 결과값이 달라지고 오류가 생기는데 한 번 실행한 작업은 다시 건드리면 안되나요? 라벨인코딩, 원핫인코딩 모두 실행하고 분리한 데이터 다시 합쳤을 때 컬럼이 107로 나와야하는데 처음이랑 그대로인 15가 나오더라구요 다시 올라가서 실행하니 전부 오류가 뜹니다 ㅜㅠ!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원-핫 인코딩
원-핫 인코딩 했을 때 데이터가 0또는 1이 아니라 false나 true로 나오는데 문제 없는 건가요?false를 0으로 true를 1로 보면 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회기출 제1유형 2번
6회기출 제1유형 2번위 내용에보면교사수 구하는 문제인데,맨 위에 29.9비율 제일 높은 교사수는 20인데왜 답이 19인지 모르겠습니다.확인 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제1유형 답변
안녕하세요.제1유형 문제를 풀고, 답변을 수기로 쳐도되나요?예를들어,제3회기출 제1유형 1번답이 f1이라고하면그냥ans = 'f1'print(ans)이렇게 답을 처도되는건가 문의드립니다.