묻고 답해요
160만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)문제 8결측 값을 가진 데이터는 바로 뒤에 있는 값으로 대체한 후 (바로 뒤가 결측값이라면 뒤에 있는 데이터 중 가장 가까운 값)city와 f2 컬럼 기준으로 그룹합을 계산한 뒤views가 세번째로 큰 city(도시) 이름은?문제를 푸는데.. df = df.fillna(method='bfill')라고 치면 <ipython-input-43-5b45f8741ad5>:7: FutureWarning: DataFrame.fillna with 'method' is deprecated and will raise in a future version. Use obj.ffill() or obj.bfill() instead. df = df.fillna(method='bfill')과 같은 메시지가 뜨네요. 이제 df = df.fillna(method='bfill') 대신 obj.bfill() 라고 쓰는걸 익혀야 하나요? 아니면 당분간은 괜찮을런지요. 늘 감사합니다. 
- 
      
        
    미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)수강 일시정지 문의 드립니다.선생님 안녕하세요!제가 갑자기 이번 실기 시험을 못보게 되어서 이 강의를 올해 2차 시험은 볼 수 있는데, 시간이 지나면 내년 1차 시험에 강의를 못들을 거 같아서 걱정입니다. 두 달 정도 강의를 일시정지 요청드립니다. 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)기출 7회 - 작업형1 - 1번 문제안녕하세요.작업형1만 학습한 상태로 문제를 푸느라, 스케일 공식을 따로 불러오지 않고 다음과 같이 풀었습니다. score_mean = df['score'].mean()score_std = df['score'].std()df['score_standard'] = (df['score'] - score_mean) / score_stdresult = round(df['score_standard'].max(), 3)print(result) 위 풀이는 답으로 2.150가 나오는데선생님 풀이와 같은 답(2.183)이 나오려면 std(ddof=0)을 입력해야 합니다.그럼 모표준편차를 구해야 한다는 걸까요? (+ 스케일 공식은 모표준편차를 구하는 공식인 걸까요?) 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)train데이터와 test데이터의 분리 후 인코딩? 인코딩 먼저 하고 난 뒤 분리?분리 후 원핫 인코딩의 경우 train데이터와 test 데이터의 컬럼 갯수가 서로 맞지 않을 경우도 있다고 하셨는데그럼 무조건 두개의 합친 데이터에서 인코딩 먼저 하고 난 뒤에 분리하면 안되는걸까요? 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)자동 초기화학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요새로 접속할때마다 이전코드를 하나하나 다 실행하기가 귀찮은데 자동으로 하는법 없나요> 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)n-test 민맥스 스케일링은 transform만 하는거라고 하셨는데n_train이 민맥스 스케일링해서 훈련되면n_test는 그대로 train이 한대로 tranform만 하는것이라고 말씀해주셨는데n_test 데이터들이 n_tarin의 민맥스 스케일링값을 어찌 알고 훈련된대로 값이 부여되는걸까요 #민-맥스 스케일링(MinMaxScaler 모든값이 0과 1사이) from sklearn.preprocessing import MinMaxScaler scaler =MinMaxScaler() display(n_train.head(2)) n_train[cols] = scaler.fit_transform(n_train[cols]) n_test[cols] = sclaer.tranform(n_test[cols]) 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)강의 업데이트 관련 문의안녕하세요!10회 시험 대비 강의 업데이트 관련해서 문의드립니다.기왕이면 업데이트 완료된 강의를 수강하고 싶어서요..! ‘작업형2’의 최종 업데이트 예정일이 어떻게 될까요?‘작업형3’도 업데이트 예정이실까요? 그렇다면 업데이트 일정이 어떻게 될까요?1,2번 문의 외 업데이트 예정인 강의가 또 있을까요? 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)마지막 퀴즈listbox = [15, 46, 78, 24, 56] def answer(listbox): result = max(listbox) - min(listbox) return result answer(listbox)마지막 퀴즈 문제에서 저렇게 풀어도 문제는 없는건가요 ??저는 함수명을 answer로 설정하고 data 대신 listbox를 바로 받았는데 이렇게 풀어도 문제가 없는지 궁금합니다. 
- 
      
        
    미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)4회 작업형1학습 자료가 잘못 올라가진 것 같습니다.이전에 다른 분 질문자의 답변에 자료를 찾지 못하겠네요. 수업 자료 다시 한번 업로드 부탁드립니다. 
- 
      
        
    미해결[개정판] 파이썬 머신러닝 완벽 가이드TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 - 02 강의내용 질문입니다안녕하세요168. TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 - 02강의에서9:50 부분을 보면find_sim_movie() 함수가 있습니다강의 동영상에서는 The Godfather 와 유사도가 높은 순으로 결과가 나왔는데The Godfather 가 유사도가 가장 높아야 되는데The Godfatehr 가 아니고 다른 영화가유사도가 가장 높은 것으로 나옵니다왜 이런 결과가 나오는지 설명 부탁드립니다 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)[기출] 6회 - 작업형1 - 문제1다음과 같이 코드를 작성했는데, 결과값에 .0 이 붙어서 출력됩니다.왜 그런 걸까요? df['출동시간'] = pd.to_datetime(df['출동시간'])df['도착시간'] = pd.to_datetime(df['도착시간'])df['time'] = df['도착시간'] - df['출동시간'] result = df.groupby('소방서')['time'].mean()result = result.sort_values(ascending=False)result = round(result.dt.total_seconds() / 60)# round 함수에 반올림 위치를 명시하지 않으면 정수를 반환해야 하지 않나요?) print(result[0]) 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)2회 작업형2유형 질문학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요2회 기출문제 작업형2에서 왜 쌤이 한거랑 다르게 결과가 나올까요,,,,,,,,# 검증 데이터 분리아래는 쌤 풀이 입니다((7039, 11), (1760, 11), (7039,), (1760,)) 이건 제가 작성한 코드입니다 from sklearn.model_selection import train_test_splitX_tr,X_val,y_tr,y_val = train_test_split( X_train, y_train['Reached.on.Time_Y.N'], test_size=0.2, random_state=2022 )X_tr.shape, X_val.shape, y_tr.shape, y_val.shape((7039, 10), (1760, 10), (7039,), (1760,)) 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)2유형 이진, 다중, 회귀 구분하는 것 문의이진, 다중, 회귀의 문제 종류에 따라코드가 달라지는 부분이 있나요? (평가지표 제외)없는 것 같아서 시험 보면서 어떤걸 유의해야하는지 모르겠습니다. 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)4회 기출 작업형2에서는 모델 학습만 하고 평가는 안하셨는데 실제로 평가 안하고 학습하고 바로 제출해도 되나요? 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)53강.작업형3기출문제선생님~ 53강은 제목에 구버전이라고 적혀있는데 공식사이트에서 삭제되었다고 하고구버전/신버전 차이가 뭐죠? 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)오징어게임 문의드립니다.안녕하세요. 오징어게임 관련해서 문의사항이 있어 남깁니다. 5/12 미션 [2-a 도서] 작업형1 연습문제 - 섹션1, 섹션2 (p.164~165)의 경우 시나공 2026 버전으로 작성해주신 것 같은데 제가 갖고 있는 2025 버전의 경우는, 섹션을 기준으로 풀면 되는지 문의드립니다! 답변해주시면 감사하겠습니다^^ 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)3회 기출유형 작업형2# test 예측 pred = rf.predict_proba(test) ValueError Traceback (most recent call last) <ipython-input-221-192ffa211ac4> in <cell line: 0>() 1 # test 예측 ----> 2 pred = rf.predict_proba(test) 3 3 frames /usr/local/lib/python3.11/dist-packages/sklearn/utils/validation.py in _check_feature_names(estimator, X, reset) 2775 message += "Feature names must be in the same order as they were in fit.\n" 2776 -> 2777 raise ValueError(message) 2778 2779 ValueError: The feature names should match those that were passed during fit. Feature names unseen at fit time: - TravelInsurance이런 오류가 뜹니다 test가 예측값이니까 TravelInsurance 컬럼이 없어야 하는게 맞는건가요? 샘플 찍어봤을 때 train,test 둘 다 TravelInsurance 이 컬럼이 있었습니다. 코드 작성은 선생님과 동일하게 했는데 자꾸 저런 오류가 뜨네요 ㅠㅠ 검증 데이터 분리할 때 train.drop만 해줘서 그런건가요..? 
- 
      
        
    해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)28. 모델링 및 평가(분류) 강의 중 xgboost 관련강의를 들으며 빈칸노트북에 바로바로 따라해보고 있습니다.다만, 의사결정나무 랜덤포레스트는 이상없이 예측값이 나오는데xgboost는 datatype 오류가 나옵니다.이유가 무엇인지 알수 있을까요? 
- 
      
        
    미해결스파크 머신러닝 완벽 가이드 - Part 1데이터 로드 및 로딩 된 파일 데이터 목록 조회 방안녕하세요! 기본적인 질문인데..titanic_train.csv 로드하는 방법 중 아래 과정중 마지막 과정 다음으로 어떻게 해야하나요? 영상 상 별다른 버튼 클릭(Create Table with UI나 Create Table in Notebook) 및 저장 없이 진행 된 듯 보이는데, 그냥 두 번째 캡처본의 'Create Table in Notebook' 누르니까 코드가 실행 되며 display, show등 작동은 합니다. 기본 디폴트 데이터 경로가 /FileStore/tables/ 인 건가요?? 로드한 titani_train.csv 이런 데이터 목록을 어디에서 볼 수 있을 지도 여쭙니다. 좌측 메뉴에서 Catalog 누르면 캡처본처럼 Data라는게 뜨는데 아무런 테이블(데이터)가 없다고 뜨네요.. 근데 코드는 실행이 되니 어찌 된 건 지 잘 모르겠습니다ㅜㅡㅜ 
- 
      
        
    미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)Notion 관련 문의안녕하세요, 강사님!강의 자료 중 Notion 페이지가 많은데, 강의마다 따로 링크가 있어서 한번에 보기가 좀 불편한 것 같습니다. 혹시 강의 자료 한번에 합쳐진 링크를 공유해주실 수 있으실까요? 
