묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제3
작업형2 모의문제3에서 xgb모델을 사용할 때 max_depth 기본 설정이 3으로 되어 있어서 max_depth=3을 코드에 넣었을 때와 넣지 않았을 때가 값이 똑같아야 한다고 설명해주셨는데 저는 값이 다르게 나와요. 왜 다르게 나올까요..그리고 머신러닝 강의를 따라하다보면 결과 값이 종종 영상과 다르게 나오는 경우가 있는데 코드를 똑같이 작성해도 값이 다를 수 있나요?from xgboost import XGBClassifier xgb=XGBClassifier(random_state=2022) xgb.fit(X_tr,y_tr) pred=xgb.predict(X_val) pred_proba=xgb.predict_proba(X_val) print(roc_auc_score(y_val, pred_proba[:,1])) print(f1_score(y_val, pred)) print(accuracy_score(y_val, pred)) ->0.9192546583850931 0.8444444444444444 0.8108108108108109 from xgboost import XGBClassifier xgb=XGBClassifier(random_state=2022, max_depth=3) xgb.fit(X_tr,y_tr) pred=xgb.predict(X_val) pred_proba=xgb.predict_proba(X_val) print(roc_auc_score(y_val, pred_proba[:,1])) print(f1_score(y_val, pred)) print(accuracy_score(y_val, pred))->0.8975155279503105 0.8444444444444444 0.8108108108108109
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
피처엔지니어링 13.00초 부분 질문이 있습니다.
for col in cols le = labelencoder()C_Train[col] = le.fit_transform(C_train[col]) 여기에서요. col 이라는 피처는 for col 반복문 에서 처음 생겼는데 C_train[col] 변수에 담을 transform(c_train[col])의 피처 col은 어디서 생겨난지 모르겟어서요.. 반복문 처음에 col로 피처를 생성한거를 c_train[col]이라고 명시하는 순간 col 칼럼이 생기면서 그 값을 알아서 가져오는 건가요???
-
미해결실리콘밸리 데이터 리더가 알려주는 Airflow 기초
Airflow 웹 UI에서 파일 디렉토리 구조 확인이 가능한가요?
안녕하세요.「앞서 Airflow 예제를 개선해보자 (v3) - 실습 편」 강의 수강 중 궁금한 점이 있어 문의드립니다.DAG 실행 시 생성되는 tmp 파일이 제대로 생성되었는지 확인하고 싶어, CLI 환경이 아닌 웹 UI상에서 확인할 수 있는 방법이 있는지 알아보던 중 궁금한 점이 생겼습니다./opt/airflow 디렉토리 구조는 CLI 환경에서만 확인 가능한 것인지, 웹 UI상에서는 해당 경로의 파일 구조를 직접 확인할 수 없는 것인지 궁금합니다.추가로 확인이 가능한 부분이 있다면 현업에서는 어떻게 주로 확인하는지도 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
원래 원핫인코딩은 범주형 변수에만 적용가능하지 않나요? 강사님께서는 굳이 수치형과 범주형을 나누지 않고 train = pd.get_dummies(train), test = pd.get_dummies(test)하셨는데 이렇게 굳이 나누지 않고 원핫인코딩을 적용해도 괜찮나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4-3 작업형1 모의문제3의 문제7번 문의드립니다
df = pd.read_csv("data.csv", index_col="Unnamed: 0")# your codedf=df.T df.head() #print(df[2001].mean()) a=sum(df[2001]>df[2001].mean()) #print(df[2003].mean()) b=sum(df[2003]<df[2003].mean()) print(a+b) 이렇게 풀어도 괜찮은걸까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 기출 작업형3 1번문제
1번문제는 범주형 데이터 분석이라고 하셨는데 어떻게 구분하나요? 저는 처음에 이 문제가 두 집단이 있어 독립표본 검정을 사용해야겠다라고 생각했습니다.
-
해결됨38군데 합격 비법, 2025 코딩테스트 필수 알고리즘
k번째 값 출력하기 문제에서 이렇게 풀어도 되나요?
2주차 끝 숙제 중 링크드리스트의 끝에서 k번째 값 출력하기 문제를 처음에 먼저 혼자 풀어볼 땐 링크드리스트를 순회하면서 각 노드를 따로 생성한 배열에 담고 return 할 땐 -k 인덱스로 끝에서 k번째 값을 가져오도록 해봤습니다. 답은 나오긴 하는데 혹시 이런 식으로 풀어도 되나요?? cur = self.head arr = [] while cur is not None: arr.append(cur) cur = cur.next return arr[-k]
-
미해결데이터분석가 서류탈락? 알려드릴게요, 되는 포트폴리오
캐글 관련질문입니다.
캐글 이야기를 많이 하시고 저도 데이터 분석가라면 캐글에 친숙해지고 캐글 컴페티션을 잘해야 한다고 생각하는데요 캐글이 전부 영어로 되어있고 페이지 번역이 되긴하지만 실제 노트북에서 모델을 돌리는 과정이나 튜토리얼안의 스크립트나 코멘트들은 페이지번역도 안되는 문제가 있더라구요어떻게 공부 하셨는지가 궁금합니다.영어실력부터 쌓아야 하는건가요?데이콘이라는 한국 사이트가 있긴하지만 대부분 유료화 되어있고혹시 영어 원문 그대로 보셨는지 아니면 다른 방법이 있으셨는지도 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 자료 업로드 문의
안녕하세요 강사님, 강의 잘 듣고 있습니다.혹시 슬라이드 형태로 공유 주시는 자료를 별도 pdf나 파일로 업로드 해주실 수 있으실지 문의드립니다.e.g.) 섹션 5. [작업형2] 머신러닝 및 평가지표 -머신러닝 프로세스 매번 일부 슬라이드를 스크린샷 해서 보고 있어 살짝 불편합니다.혹시 가능할지 확인해주시면 감사하겠습니다 :)
-
미해결프로그래밍 시작하기 : 파이썬 입문 (Inflearn Original)
섹션 1 강의자료 다운로드는 어디서
안녕하세요섹션1 강의자료가 동영상과는 다르게 없는데요?어디서 받아요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제1
이탈할 고객의 확률이기 때문에 인덱스가 1인 컬럼을 선택해야해서 pred[:,1] 를 쓴다고 하셨는데,이탈할 고객의 확률의 인덱스가 1인지 어떻게 아나요..?# roc-auc pred = model.predict_proba(X_val) print(roc_auc_score(y_val, pred[:,1]))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요 선생님
제가 일단 판다스기본 보고있는데.. 코드가 원리같은건 이해를 하겠는데 직접 타이핑할때 아직 세세하게 기억이 나질않아서 꼭 답을 보면 생각나더라구요.. 괄호 사용이나 메서드 사용법같은.. 현재 제 상태면 판다스 기본만 일단 계속 봐야하나요? 아니면 진도를 계속 나가도 되나요..? 이게 진도를 나가면서 문제통해서 배우는건지 판다스기본 완벽하게 마스터하고 나가야하는지 모르겠습니다 ㅠ
-
해결됨(2025) 일주일만에 합격하는 정보처리기사 실기
비교연산자와 반복문+조건문 문제 풀이 (v2) 영상버퍼링
비교이영상만 버퍼링 재생안되서 퀴즈를 못풀고 있어요연산자와 반복문+조건문 문제 풀이 (v2) 이영상만 버퍼링 제 풀이 (v이 (v2)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 데이터 불러올때
type 확인 후 cols = ['age', 'fnlwgt', 'education.num', 'capital.gain', 'capital.loss', 'hours.per.week']이렇게 수치형 데이터의 열만 복사하는 거 말고 cols = X_train.select_dtypes(exclude='object').copy()를 사용해도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링, 인코딩 등 데이터 작업후에
스케일링, 인코딩 등 데이터 작업후에 위로 올라가서 다시 실행하면 처음이라 결과값이 달라지고 오류가 생기는데 한 번 실행한 작업은 다시 건드리면 안되나요? 라벨인코딩, 원핫인코딩 모두 실행하고 분리한 데이터 다시 합쳤을 때 컬럼이 107로 나와야하는데 처음이랑 그대로인 15가 나오더라구요 다시 올라가서 실행하니 전부 오류가 뜹니다 ㅜㅠ!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원-핫 인코딩
원-핫 인코딩 했을 때 데이터가 0또는 1이 아니라 false나 true로 나오는데 문제 없는 건가요?false를 0으로 true를 1로 보면 될까요?
-
미해결Airflow 마스터 클래스
task run fail
섹션3. Bash operator DAG 만들기 & DAG 디렉토리 셋팅안녕하세요, 에어플로우에 dags_bash_operator를 올리면 사진과 같이 몇 번을 시행해도 사진과 같이 실패합니다.sudo docker ps로 상태 확인해보면 별다른 문제가 없는 것 같은데, 문제의 원인이 무엇일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회기출 제1유형 2번
6회기출 제1유형 2번위 내용에보면교사수 구하는 문제인데,맨 위에 29.9비율 제일 높은 교사수는 20인데왜 답이 19인지 모르겠습니다.확인 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제1유형 답변
안녕하세요.제1유형 문제를 풀고, 답변을 수기로 쳐도되나요?예를들어,제3회기출 제1유형 1번답이 f1이라고하면그냥ans = 'f1'print(ans)이렇게 답을 처도되는건가 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분산 분석에서 정규성 & 등분산성 가정에 대해서 질문드립니다.
일원, 이원 분산 분석에서 정규성 & 등분산성 가정을 위반될 때 에 대한 질문이 있습니다.일원 분산 분석에서 정규성 검정은 충족하는데 등분산 가정이 충족되지 못하면 일원 분산 분석을 진행하지 못하나요?이원 분산 분석에서 정규성 검정 혹은 등분산 검정 둘중 하나라도 충족되지 못하면, 이원 분산 분석을 진행하지 못하나요? 위의 1, 2 번 질문은 강사님이 다뤄주신 프로세스에 없는 부분인데 이러한 부분이 시험 출제 가능성이 있는지 궁금합니다.감사합니다.