묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 작업형1
학습 자료가 잘못 올라가진 것 같습니다.이전에 다른 분 질문자의 답변에 자료를 찾지 못하겠네요. 수업 자료 다시 한번 업로드 부탁드립니다.
-
해결됨[2025] 비전공자도 한 번에 합격하는 SQLD 올인원
null 값 정렬 위치
안녕하세요, 강의 수강중인 학생입니다.정렬 과정에서 NULL 값이 있으면, 오름차순은 맨 아래로, 내림차순은 맨 위로라고 교재에 작성되어 있는데, 문제 풀이에는 그 기준이 적용되는 것 같지 않아 정확하게 알고 싶습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[기출] 6회 - 작업형1 - 문제1
다음과 같이 코드를 작성했는데, 결과값에 .0 이 붙어서 출력됩니다.왜 그런 걸까요? df['출동시간'] = pd.to_datetime(df['출동시간'])df['도착시간'] = pd.to_datetime(df['도착시간'])df['time'] = df['도착시간'] - df['출동시간'] result = df.groupby('소방서')['time'].mean()result = result.sort_values(ascending=False)result = round(result.dt.total_seconds() / 60)# round 함수에 반올림 위치를 명시하지 않으면 정수를 반환해야 하지 않나요?) print(result[0])
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 작업형2유형 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요2회 기출문제 작업형2에서 왜 쌤이 한거랑 다르게 결과가 나올까요,,,,,,,,# 검증 데이터 분리아래는 쌤 풀이 입니다((7039, 11), (1760, 11), (7039,), (1760,)) 이건 제가 작성한 코드입니다 from sklearn.model_selection import train_test_splitX_tr,X_val,y_tr,y_val = train_test_split( X_train, y_train['Reached.on.Time_Y.N'], test_size=0.2, random_state=2022 )X_tr.shape, X_val.shape, y_tr.shape, y_val.shape((7039, 10), (1760, 10), (7039,), (1760,))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 이진, 다중, 회귀 구분하는 것 문의
이진, 다중, 회귀의 문제 종류에 따라코드가 달라지는 부분이 있나요? (평가지표 제외)없는 것 같아서 시험 보면서 어떤걸 유의해야하는지 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 기출 작업형2
에서는 모델 학습만 하고 평가는 안하셨는데 실제로 평가 안하고 학습하고 바로 제출해도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
53강.작업형3기출문제
선생님~ 53강은 제목에 구버전이라고 적혀있는데 공식사이트에서 삭제되었다고 하고구버전/신버전 차이가 뭐죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오징어게임 문의드립니다.
안녕하세요. 오징어게임 관련해서 문의사항이 있어 남깁니다. 5/12 미션 [2-a 도서] 작업형1 연습문제 - 섹션1, 섹션2 (p.164~165)의 경우 시나공 2026 버전으로 작성해주신 것 같은데 제가 갖고 있는 2025 버전의 경우는, 섹션을 기준으로 풀면 되는지 문의드립니다! 답변해주시면 감사하겠습니다^^
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 기출유형 작업형2
# test 예측 pred = rf.predict_proba(test) ValueError Traceback (most recent call last) <ipython-input-221-192ffa211ac4> in <cell line: 0>() 1 # test 예측 ----> 2 pred = rf.predict_proba(test) 3 3 frames /usr/local/lib/python3.11/dist-packages/sklearn/utils/validation.py in _check_feature_names(estimator, X, reset) 2775 message += "Feature names must be in the same order as they were in fit.\n" 2776 -> 2777 raise ValueError(message) 2778 2779 ValueError: The feature names should match those that were passed during fit. Feature names unseen at fit time: - TravelInsurance이런 오류가 뜹니다 test가 예측값이니까 TravelInsurance 컬럼이 없어야 하는게 맞는건가요? 샘플 찍어봤을 때 train,test 둘 다 TravelInsurance 이 컬럼이 있었습니다. 코드 작성은 선생님과 동일하게 했는데 자꾸 저런 오류가 뜨네요 ㅠㅠ 검증 데이터 분리할 때 train.drop만 해줘서 그런건가요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
28. 모델링 및 평가(분류) 강의 중 xgboost 관련
강의를 들으며 빈칸노트북에 바로바로 따라해보고 있습니다.다만, 의사결정나무 랜덤포레스트는 이상없이 예측값이 나오는데xgboost는 datatype 오류가 나옵니다.이유가 무엇인지 알수 있을까요?
-
미해결스파크 머신러닝 완벽 가이드 - Part 1
데이터 로드 및 로딩 된 파일 데이터 목록 조회 방
안녕하세요! 기본적인 질문인데..titanic_train.csv 로드하는 방법 중 아래 과정중 마지막 과정 다음으로 어떻게 해야하나요? 영상 상 별다른 버튼 클릭(Create Table with UI나 Create Table in Notebook) 및 저장 없이 진행 된 듯 보이는데, 그냥 두 번째 캡처본의 'Create Table in Notebook' 누르니까 코드가 실행 되며 display, show등 작동은 합니다. 기본 디폴트 데이터 경로가 /FileStore/tables/ 인 건가요?? 로드한 titani_train.csv 이런 데이터 목록을 어디에서 볼 수 있을 지도 여쭙니다. 좌측 메뉴에서 Catalog 누르면 캡처본처럼 Data라는게 뜨는데 아무런 테이블(데이터)가 없다고 뜨네요.. 근데 코드는 실행이 되니 어찌 된 건 지 잘 모르겠습니다ㅜㅡㅜ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Notion 관련 문의
안녕하세요, 강사님!강의 자료 중 Notion 페이지가 많은데, 강의마다 따로 링크가 있어서 한번에 보기가 좀 불편한 것 같습니다. 혹시 강의 자료 한번에 합쳐진 링크를 공유해주실 수 있으실까요?
-
해결됨[2025]비전공자도 한 번에 합격하는 SQLD Part2
Part 2 > Chapter 2 단원 정리 문제] 질의
강의 잘 듣고 있습니다. ! Part 2 > Chapter 2 단원 정리 문제] 에서 5번문제 SALES.AMOUNT 중에서 100보다 큰 값alice, carol, bob 전부 해당되는거 아닌가요? ;;
-
해결됨[2025] SQLD 문제가 어려운 당신을 위한 노랭이 176 문제 풀이
강의 자료 관련
안녕하세요176 문제라고 되있는데 '2.노랭이 해설지 안내'에는 총 126제가 나와있는것 같습니다.실전 모의고사는 3회라 총 150문제 되는것 같구요176 문제는 어느 부분을 기준으로 되어있는건지요?? 그리고노랭이 문제집을 별도로 혹시 사야되는지 문의드립니다. (혹시 해설만 자료가 있다면 문제까지 따로 있어야 공부가 될것 같아서요)답변 부탁드립니다~
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 스케일러와 범주형 인코딩 관련 컬럼지정 질문
2유형 학습중 이해를 잘 못한 부분이 있습니다. 먼저 수치형 변수 스케일러의 경우스케일러함수(train) 이렇게만 사용하거나스케일러함수(train['수치형변수'] 이렇게 사용할 때가 있고 동일하게 변수형 변수 인코딩의 경우라벨인코딩(train) 이렇게는 사용 안하고항상 라벨인코딩(train[cols]) 이렇게 사용하시는데원핫인코딩(train) 이런식으로 사용하시는 부분에 있어서 어떤 함수가 파이썬에서 자동으로 수치형과 범주형을 구분해서 변환해주는지 궁금합니다. GPT에도 확인했지만 물어볼 때마다 답이 다르네요...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시나공 교재에 해당 내용은 없나요?
2026년 시나공교재도 같이 활용해서 하고있는데 이 교재에 모의문제 내용은 없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코랩 모의문제 풀이 질문
문제를 풀다가 유사한 코드를 작성하니 정답이 보여서 질문 드립니다 안뜨게 할 수 있을까요?
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
작업형 제 2유형 질문
잦은 질문으로 귀찮게 해드려 죄송합니다 ㅜ2유형에서 지금까지 기출에서 결측치가 없는 상태로 출제가 되었는데 만약 결측치가 있을 경우코딩순서와 어떻게 결측치를 대치하는지 풀이가 궁금합니다ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
cond 변수
cond = df['age'] <= 0 df[cond] 위에서 보통 df 뒤에 컬럼명을 적을 때 'age'컬럼처럼 따옴표를 붙여주는데, cond같은 경우에는 안붙여도 출력이 되는데 어떤 이유일까요?cond가 컬럼명이 아니라 변수명이기 때문에 그런건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제3
문제에서 평가지표가 ROC-AUC, 정확도, F1 세가지가 있고모델&평가할 때 이 지표 세가지를 다 구해서 확인을 했는데마지막에 test데이터를 활용해서 실제 예측을 할 때는 왜 pred_proba를 사용한건가요?ROC-AUC를 기준으로 선택해서 그런건가요?그럼 정확도 기준으로 선택하면 pred 사용해도 되는건가요? <문제>## 심장마비 확률이 높은사람?- 성별, 나이, 혈압, 콜레스테롤, 공복혈당, 최대 심박수 등의 컬럼이 있음- 평가: ROC-AUC, 정확도(Accuracy), F1 을 구하시오- target : output (1:심장마비 확률 높음, 0:심장마비 확률 낮음)- csv파일 생성 : 수험번호.csv (예시 아래 참조) <모델&평가># xgbfrom xgboost import XGBClassifierfrom sklearn.metrics import roc_auc_score, f1_score, accuracy_scorexgb = XGBClassifier(random_state=2022)xgb.fit(X_tr, y_tr)pred = xgb.predict(X_val)pred_proba = xgb.predict_proba(X_val)print(roc_auc_score(y_val, pred_proba[:,1]))print(f1_score(y_val, pred))print(accuracy_score(y_val, pred)) <예측 및 csv 제출>pred_proba = xgb.predict_proba(test)