묻고 답해요
164만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 기출 작업형02
6회 기출 다중분류 문제에서XGB를 사용하면 오류가 나는데 이유가 뭘까요? from xgboost import XGBClassifiermodel = XGBClassifier(random_state=0, verbose=-1) /usr/local/lib/python3.12/dist-packages/xgboost/sklearn.py in fit(self, X, y, sample_weight, base_margin, eval_set, verbose, xgb_model, sample_weight_eval_set, base_margin_eval_set, feature_weights) 1756 or not (classes == expected_classes).all() 1757 ): -> 1758 raise ValueError( 1759 f"Invalid classes inferred from unique values of `y`. " 1760 f"Expected: {expected_classes}, got {classes}" ValueError: Invalid classes inferred from unique values of `y`. Expected: [0 1 2 3 4], got ['High' 'Low' 'Medium' 'Very High' 'Very Low']
-
미해결스파크 머신러닝 완벽 가이드 - Part 1
데이터 브릭스 가입
안녕하세요 현재 데이터 브릭스 커뮤니티 에디션이 막힌 것 같습니다.그리고 현재 제공되는 프리 에디션 사용의 경우 cluster 생성이 안되는 것 같습니다. 현재 강의 수강에 지장이 있어 확인 후 답변 주시면 감사하겠습니다. https://learn.microsoft.com/en-us/answers/questions/2337779/how-to-create-databricks-cluster-with-the-new-data
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
전처리 작업중 원핫인코딩으로 통일해서 알려주셨는데, 랜덤포레스트 모델을 사용한다면 레이블인코딩을 사용해도 상관없을까요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장 문의드립니다.
안녕하세요 강사님.저번에 응시했던 실기 10회 시험을 아쉽게 불합격해서, 이번 11월 29일에 치뤄질 실기 11회 시험을 응시하기 위해 강의를 다시 보고자 합니다.그러나 제가 1년 전에 강의를 구매해서 11월 4일에 강의가 만료되는 상황입니다.염치없지만 혹시 10일정도 강의 연장 가능한지 여쭤봅니다..! ㅠ 감사합니다.(참고로 제 이메일은 duddms0268@gmail.com 입니다.)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
파일합치기 관련하여 문의드립니다.
안녕하세요.2회기출문제의 경우 특이하게 train데이터가 2개로 나뉘어 제공되었는데 concat 함수로 작업을 하셨는데 id가 공통적으로 있긴 하지만, 동일한 순서로 되어있는지 알수 없어서 merge 함수를 사용하여 on = "id" 옵션을 추가하여 train데이터를 하나로 만들었는데concat, merge, join 어떤 걸 사용해도 괜찮을까요 ? 언제나 답변해주셔서 감사합니다 :)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장 관련하여 문의드립니다.
안녕하세요. 퇴근후딴짓 빅데이터 분석기사 실기를 수강중인 학생입니다. 다름이 아니라 빅데이터 분석기사 실기 시험이 11월29일인데 강의 만료일이 11월13일이라 실기 시험 전 16일동안 강의를 듣지 못하네요. ㅠㅠ 시험전까지 동영상을 복습하면서 시험을 준비했으면 하는데요. 시험일까지 수강 기간을 연장할 수 있는지 문의드립니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형 변수의 회귀계수
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하십니까? 해당 강의 내용 중 회귀계수가 아래처럼 나오게 되는데 그럼 여기서 유형 A에 대한 회귀계수를 알고 싶으면 어떻게 해야하나요?summary로는 유형A의 회귀계수는 보는방법은 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 연습문제 질문사항
작업형2 연습문제 "노트북 가격 예측"에서결측치 처리를 위해 범주형 컬럼에서는 "X"값으로 대체, 수치형 컬럼에서는 -1 값으로 대체하였는데 결측치 처리시 어떤 기준으로 해야하는 지표가 있을까요? 통일성있게 적용하고 싶습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2
예시문제 작업형2에서 레이블 인코딩을 하려고 합니다.이전 수업에서 했던 방식대로# 인코딩(레이블)cols = test.select_dtypes(include='object').columnsprint(cols)# from sklearn.preprocessing import LabelEncoder# le = LabelEncoder()# for col in cols:# train[col] = le.fit_transform(train[col])# test[col] = le.transform(test[col])# print(train.info())# print(test.info()) 이렇게 진행했는데 왜 오류가 뜰까요? 강의랑 다르게 cols에 주구매상품, 주구매지점, 환불금액까지 나오긴 했습니다. 혹시 결측치를 mode로 채워서 그런걸까요 ..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 체험환경에서 신뢰구간 구할때
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요? 실기 체험환경에서 신뢰구간 구할때 결과가 이렇게 나오면 신뢰구간을 보려면 어떻게 하나요?3,4번째 컬럼을 따로 지정해서 봐야하나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간 멈춤 가능한가요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요, 이번 11/29 빅분기 시험을 사정상 보기 어려워져서학습기간 멈춤를 신청하고 싶은데 최대 몇개월 학습 중단이 가능할까요?내년 3월이후 다시 준비해서 시험을 치뤄야 될 것 같습니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험장 환경
시험장에서 자동완성은 어디까지 가능한가요? 미리정의한 변수명은 tab으로 자동완성이 되나요?함수들도 궁금합니다. 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
여러 줄 한꺼번에 주석처리
하는 방법이 있을까요?? 강의에서는 슉슉 빠르게 되는 것이 신기해서 여쭤봅니다!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 데이터 코랩에서 불러오기
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 캐글에 있는 문제들 코랩에서 풀어보려고하는데 데이터를 어떻게 불러와야하는지 모르겠어요ㅜ깃허브 URL이나 이런건 없나요? import pandas as pd import numpy as np df = pd.read_csv('../input/titanic/train.csv')
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
독립성검정에서 correction 옵션과 관련하여 문의드립니다.
안녕하세요.제목과 같이 독립성검정의 경우 chi2_contingency 함수를 사용하는데 공부하다 보니 chi2_contingency(table, correction = True) 이렇게 되어있는 글을 보게 되어서 검색하여보니 correction 옵션은 자유도와 관련된 부분이라고 해서 자유도가 1인 경우에는 True이고 , True가 기본값이긴 하지만 1보다 클 경우에는 False를 사용해야 한다고 하는데 예시 문제를 살펴보면 ddof = 1인 경우에만 있었는데 혹시 실기에서도 해당 부분을 고려해야 할까요 ? 감사합니다 :)
-
해결됨[완독 챌린지] 『AI 엔지니어링』 5주만에 함께 읽기!
챌린지 검색이 안되서요.
시작전이긴 한데 구매했는데 리스트에 보이지 않습니다. 왜 그런걸까요?
-
미해결[왕초보] [누적 5,000명+] Python 프로그래밍 기초 완성 로드맵
변수 선언에 관련한 질문.
안녕하세요. 변수선언에 관련된 질문이 있습니다.# 하나의 변수에 하나의 값을 대입 a = 1 b = 1위와 같은 경우에 변수와 값을 띄워쓰기 하는데 붙여쓰기를 해도 동일하게 적용은 가능한데 띄워쓰기 하는 이유가 있는지 궁금합니다.
-
미해결스파크 머신러닝 완벽 가이드 - Part 1
pyspark local 설치
안녕하십니까, 강사님.PySpark에 대한 심도 있는 강의를 준비해주셔서 감사합니다. PySpark를 공부하기 전에 한 가지 궁금한 점이 있습니다.많은 분들이 PySpark를 Databricks 플랫폼에서 실행하던데, 특별한 이유가 있을까요?로컬 환경에 패키지를 설치해 직접 실행하지 않는 이유가 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
concat
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요아래처럼 concat으로 한 이후에는 model_selection시에train_oh와 test_oh가 더 나오진 않나요??X_tr, X_val, y_tr, y_val = train_test_split(train_oh, target, ,,) 이 되지는 않는지요?? print(train.shape, test.shape)data = pd.concat([train, test], axis=0)data_oh = pd.get_dummies(data)train_oh = data_oh.iloc[:len(train)].copy()test_oh = data_oh.iloc[len(train):].copy()print(train_oh.shape, test_oh.shape)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형데이터 전처리 관련 문의드립니다.
안녕하세요.EDA 단계에서 수치형컬럼들의 기초통계량을 해보니 SeniorCitizen이 0과 1로 나뉘어있는거 같아 변수 확인 후, 해당 컬럼을 범주형으로 변환 후, 작업하였는데 이렇게 변경하여 작업해도 괜찮을까요 ?범주형으로 변경 후, 작업하였을 때# 원핫인코딩 : 946.3475544795037 946.7024808036148# 레이블인코딩 : 951.0960435538027 952.7925407798712다음과 같이 결과 값이 나왔습니다.감사합니다 :)