묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 작업형2 문제 풀이 관련
강사님 풀이를 보면 수치형 데이터와 범주형 데이터를 분리해 전처리 한 후 다시 합치는 과정으로 진행하셨는데 저는 select.dtypes(inclde='object')와 select.dtypes(exclude='object')를 이용해 전처리 후 머신러닝을 진행하였습니다. roc_auc_score로 평가해보니 비슷하게 0.809가 나옵니다. 저는 수치형과 범주형을 따로 분리하고 전처리 하는게 헷갈려서 그런데 저처럼 과정을 진행해도 문제 없는거죠??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 실기 1유형의 근속연수 결측치 부분 - transform
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요df.groupby(['부서','성과등급'])['근속연수'].transform('mean')이라는 코드로 부서와 성과등급 기준 평균값을 구하신 부분에서 질문입니다. df.groupby(['부서','성과등급'])['근속연수'].mean() 위 코드와 같이 transform('mean')과 mean()이 어떤 차이점이 있는지 궁금해요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 8
결측 값을 가진 데이터는 바로 뒤에 있는 값으로 대체한 후 (바로 뒤가 결측값이라면 뒤에 있는 데이터 중 가장 가까운 값)city와 f2 컬럼 기준으로 그룹합을 계산한 뒤views가 세번째로 큰 city(도시) 이름은?문제를 푸는데.. df = df.fillna(method='bfill')라고 치면 <ipython-input-43-5b45f8741ad5>:7: FutureWarning: DataFrame.fillna with 'method' is deprecated and will raise in a future version. Use obj.ffill() or obj.bfill() instead. df = df.fillna(method='bfill')과 같은 메시지가 뜨네요. 이제 df = df.fillna(method='bfill') 대신 obj.bfill() 라고 쓰는걸 익혀야 하나요? 아니면 당분간은 괜찮을런지요. 늘 감사합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 일시정지 문의 드립니다.
선생님 안녕하세요!제가 갑자기 이번 실기 시험을 못보게 되어서 이 강의를 올해 2차 시험은 볼 수 있는데, 시간이 지나면 내년 1차 시험에 강의를 못들을 거 같아서 걱정입니다. 두 달 정도 강의를 일시정지 요청드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 7회 - 작업형1 - 1번 문제
안녕하세요.작업형1만 학습한 상태로 문제를 푸느라, 스케일 공식을 따로 불러오지 않고 다음과 같이 풀었습니다. score_mean = df['score'].mean()score_std = df['score'].std()df['score_standard'] = (df['score'] - score_mean) / score_stdresult = round(df['score_standard'].max(), 3)print(result) 위 풀이는 답으로 2.150가 나오는데선생님 풀이와 같은 답(2.183)이 나오려면 std(ddof=0)을 입력해야 합니다.그럼 모표준편차를 구해야 한다는 걸까요? (+ 스케일 공식은 모표준편차를 구하는 공식인 걸까요?)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train데이터와 test데이터의 분리 후 인코딩? 인코딩 먼저 하고 난 뒤 분리?
분리 후 원핫 인코딩의 경우 train데이터와 test 데이터의 컬럼 갯수가 서로 맞지 않을 경우도 있다고 하셨는데그럼 무조건 두개의 합친 데이터에서 인코딩 먼저 하고 난 뒤에 분리하면 안되는걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
자동 초기화
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요새로 접속할때마다 이전코드를 하나하나 다 실행하기가 귀찮은데 자동으로 하는법 없나요>
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
n-test 민맥스 스케일링은 transform만 하는거라고 하셨는데
n_train이 민맥스 스케일링해서 훈련되면n_test는 그대로 train이 한대로 tranform만 하는것이라고 말씀해주셨는데n_test 데이터들이 n_tarin의 민맥스 스케일링값을 어찌 알고 훈련된대로 값이 부여되는걸까요 #민-맥스 스케일링(MinMaxScaler 모든값이 0과 1사이) from sklearn.preprocessing import MinMaxScaler scaler =MinMaxScaler() display(n_train.head(2)) n_train[cols] = scaler.fit_transform(n_train[cols]) n_test[cols] = sclaer.tranform(n_test[cols])
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 업데이트 관련 문의
안녕하세요!10회 시험 대비 강의 업데이트 관련해서 문의드립니다.기왕이면 업데이트 완료된 강의를 수강하고 싶어서요..! ‘작업형2’의 최종 업데이트 예정일이 어떻게 될까요?‘작업형3’도 업데이트 예정이실까요? 그렇다면 업데이트 일정이 어떻게 될까요?1,2번 문의 외 업데이트 예정인 강의가 또 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마지막 퀴즈
listbox = [15, 46, 78, 24, 56] def answer(listbox): result = max(listbox) - min(listbox) return result answer(listbox)마지막 퀴즈 문제에서 저렇게 풀어도 문제는 없는건가요 ??저는 함수명을 answer로 설정하고 data 대신 listbox를 바로 받았는데 이렇게 풀어도 문제가 없는지 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 작업형1
학습 자료가 잘못 올라가진 것 같습니다.이전에 다른 분 질문자의 답변에 자료를 찾지 못하겠네요. 수업 자료 다시 한번 업로드 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[기출] 6회 - 작업형1 - 문제1
다음과 같이 코드를 작성했는데, 결과값에 .0 이 붙어서 출력됩니다.왜 그런 걸까요? df['출동시간'] = pd.to_datetime(df['출동시간'])df['도착시간'] = pd.to_datetime(df['도착시간'])df['time'] = df['도착시간'] - df['출동시간'] result = df.groupby('소방서')['time'].mean()result = result.sort_values(ascending=False)result = round(result.dt.total_seconds() / 60)# round 함수에 반올림 위치를 명시하지 않으면 정수를 반환해야 하지 않나요?) print(result[0])
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 작업형2유형 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요2회 기출문제 작업형2에서 왜 쌤이 한거랑 다르게 결과가 나올까요,,,,,,,,# 검증 데이터 분리아래는 쌤 풀이 입니다((7039, 11), (1760, 11), (7039,), (1760,)) 이건 제가 작성한 코드입니다 from sklearn.model_selection import train_test_splitX_tr,X_val,y_tr,y_val = train_test_split( X_train, y_train['Reached.on.Time_Y.N'], test_size=0.2, random_state=2022 )X_tr.shape, X_val.shape, y_tr.shape, y_val.shape((7039, 10), (1760, 10), (7039,), (1760,))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 이진, 다중, 회귀 구분하는 것 문의
이진, 다중, 회귀의 문제 종류에 따라코드가 달라지는 부분이 있나요? (평가지표 제외)없는 것 같아서 시험 보면서 어떤걸 유의해야하는지 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 기출 작업형2
에서는 모델 학습만 하고 평가는 안하셨는데 실제로 평가 안하고 학습하고 바로 제출해도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
53강.작업형3기출문제
선생님~ 53강은 제목에 구버전이라고 적혀있는데 공식사이트에서 삭제되었다고 하고구버전/신버전 차이가 뭐죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오징어게임 문의드립니다.
안녕하세요. 오징어게임 관련해서 문의사항이 있어 남깁니다. 5/12 미션 [2-a 도서] 작업형1 연습문제 - 섹션1, 섹션2 (p.164~165)의 경우 시나공 2026 버전으로 작성해주신 것 같은데 제가 갖고 있는 2025 버전의 경우는, 섹션을 기준으로 풀면 되는지 문의드립니다! 답변해주시면 감사하겠습니다^^
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 기출유형 작업형2
# test 예측 pred = rf.predict_proba(test) ValueError Traceback (most recent call last) <ipython-input-221-192ffa211ac4> in <cell line: 0>() 1 # test 예측 ----> 2 pred = rf.predict_proba(test) 3 3 frames /usr/local/lib/python3.11/dist-packages/sklearn/utils/validation.py in _check_feature_names(estimator, X, reset) 2775 message += "Feature names must be in the same order as they were in fit.\n" 2776 -> 2777 raise ValueError(message) 2778 2779 ValueError: The feature names should match those that were passed during fit. Feature names unseen at fit time: - TravelInsurance이런 오류가 뜹니다 test가 예측값이니까 TravelInsurance 컬럼이 없어야 하는게 맞는건가요? 샘플 찍어봤을 때 train,test 둘 다 TravelInsurance 이 컬럼이 있었습니다. 코드 작성은 선생님과 동일하게 했는데 자꾸 저런 오류가 뜨네요 ㅠㅠ 검증 데이터 분리할 때 train.drop만 해줘서 그런건가요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
28. 모델링 및 평가(분류) 강의 중 xgboost 관련
강의를 들으며 빈칸노트북에 바로바로 따라해보고 있습니다.다만, 의사결정나무 랜덤포레스트는 이상없이 예측값이 나오는데xgboost는 datatype 오류가 나옵니다.이유가 무엇인지 알수 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Notion 관련 문의
안녕하세요, 강사님!강의 자료 중 Notion 페이지가 많은데, 강의마다 따로 링크가 있어서 한번에 보기가 좀 불편한 것 같습니다. 혹시 강의 자료 한번에 합쳐진 링크를 공유해주실 수 있으실까요?