묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 기출 작업형2
섹션14 작업형2 어떤 부분이 문제일까요 ㅠㅠ?ValueError: could not convert string to float: 'Healthcare' 이런 오류가 뜹니다.. target = train.pop('Segmentation')test_ID = test.pop('ID') # 연속형 변수 스케일링num = ['Age', 'Work_Experience', 'Family_Size']from sklearn.preprocessing import RobustScalerscaler = RobustScaler()train[num] = scaler.fit_transform(train[num])test[num] = scaler.fit_transform(test[num]) # 범주형 변수 원핫인코딩cols = ['Gender', 'Ever_Married', 'Graduated', 'Spending_Score']train = pd.get_dummies(data = train, columns = cols)test = pd.get_dummies(data = test, columns = cols) # 평가from sklearn.ensemble import RandomForestClassifiermodel = RandomForestClassifier()model.fit(train, target)pred = model.predict(test) # 제출pred = model.predict(test)pd.DataFrame({'ID': test_cust_id, 'Segmentation': pred}).to_csv('003000000.csv', index=False)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 11 작업형2 구버전 문의
피처엔지니어링 부분에서from sklearn.preprocessing import LabelEncoder cols = ['주구매상품', '주구매지점'] for col in cols: le = LabelEncoder() X_train[col] = le.fit_transform(X_train[col]) X_test[col] = le.transform(X_test[col]) X_train.head()이 코드 실행했을때 ValueError: invalid literal for int() with base 10: '골프' 이런 에러가 뜨는데 이유가 무엇인가요..?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
goorm 작업환경에서 코딩 중 엔터 칠 때마다 들여쓰기 되는 현상
30,32~36번 부분 처럼엔터 칠 때마다 들여쓰기가 기본으로 되어지는데... 이거 어떻게 원래대로 돌릴 수 있을까요...??초기화 버튼을 눌러도 계속 이렇게 되네요...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회기출문제 작업형2 검증데이터 분리 질문
섹션13 3회 기출유형(작업형2)6:15검증데이터 분리에서 (('TravelInsurance', axis = 1), train['TravelInsurance'], test_size = 0.1, random_state = 1204)위에 알려주신 방법 말고 (train, train[‘TravelInsurance’], test_size = 0.1, random_state = 1204)전처리 단계에서 불필요한 컬럼으로 간주하고 drop 후에 분리에서 윗 줄처럼 해도 될까요? 만약 안된다면, 괄호 안에 앞 2개가 매번 달라서 어떻게 입력해야할지 잘 모르겠어요. 이 문제에서 drop 방법은 왜 사용 안하신건지 궁금합니다. 제출할 때 'index' = test.index로 들어가는것도 왜 그런지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 기출유형 작업형 2번 관련
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하십니까지금 공부 중에 nunique 사용 법에 대한 문의 입니다.아래와 같이 코딩하면값은X_train.describe(include = 'O').nunique() 를 사용하면Warehouse_block 4 Mode_of_Shipment 4 Product_importance 4 Gender 4 dtype: int64 로 나오는데요 실제 문제에서 알려주신 코딩으로 하면X_train[['Warehouse_block', 'Mode_of_Shipment', 'Product_importance', 'Gender']].nunique()각 5, 3, 3, 2가 나오네요차이점이 무엇인지 궁금합니다..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
macro
다중분류에서 쓰는 average = 'macro'가 무슨 의미일까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 유형2 제출 질문
작업형 유형2 제출시 아래와 같이 csv 파일을 제출할 텐데pred = model.predict_proba(test)pd.DataFrame({ 'pred':pred[:,1]}).to_csv('result.csv',index=False)아래와 같이 csv파일 확인하고 출력되는 값이 있는 코드 그대로 제출해도 괜찮나요?print(pd.read_csv('result.csv')) 아니면 print(pd.read_csv('result.csv')) 부분을 확인하고 주석처리하고 제출해야 하나요...?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제 2 -문제6 질문입니다!
이렇게 작성해도 되는지 질문드립니다!!값은 정상적으로 출력됐는데, 밑에<ipython-input-163-67625b6c418c>:16: UserWarning: Boolean Series key will be reindexed to match DataFrame index. df = df[cond1]이런 오류코드가 같이 딸려나와요.. 시험장에서 이런 오류가 같이 딸려나오면 감점인가요? 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경에서 print(help(pandas.corr)) 은 안먹나요?
안녕하세요.시험환경에서 dir과 help를 써서 힌트를 얻고 싶습니다.예를들어 회귀분석 상관관계 corr()에 대한 힌트를 얻으려면 어떻게 해야할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 작2
from sklearn.metrics import mean_squared_errormse=mean_squared_error(y_val,pred)rmse=mse**0.5rmse(y_val,pred) 이렇게 쳤더니 TypeError Traceback (most recent call last) <ipython-input-71-c64d244aa8ba> in <cell line: 1>() ----> 1 rmse(y_val,pred) TypeError: 'numpy.float64' 에러가 나오네요ㅜ 왜그런가요?from sklearn.metrics import mean_squared_errormse=mean_squared_error(y_val,pred)rmse=mse**0.5rmse이렇게 치면 애러 안나오고 값이 출력되요
-
미해결인공지능을 활용한 이상거래 검출 기법
실습: 001. Imbalanced Dataset Sampling 관련 질문
안녕하세요. 좋은 강의 감사합니다. 실습 001. 템플릿을 주피터에서 사용하다 아래와 같은 에러가 발생하였는데 해결책을 찾지 못해 문의드립니다.라이브러리의 import가 되지 않았다는 내용인 것 같아서, pip show imblearn도 해보았더니 unknown으로 나오는데 혹시 관련이 있는 내용인지요. ImportError Traceback (most recent call last) Cell In[3], line 5 3 import seaborn as sns 4 from sklearn.datasets import make_classification ----> 5 from imblearn.over_sampling import RandomOverSampler 6 from imblearn.under_sampling import RandomUnderSampler File ~/anaconda3/lib/python3.11/site-packages/imblearn/__init__.py:52 48 sys.stderr.write("Partial import of imblearn during the build process.\n") 49 # We are not importing the rest of scikit-learn during the build 50 # process, as it may not be compiled yet 51 else: ---> 52 from . import ( 53 combine, 54 ensemble, 55 exceptions, 56 metrics, 57 over_sampling, 58 pipeline, 59 tensorflow, 60 under_sampling, 61 utils, 62 ) 63 from ._version import __version__ 64 from .base import FunctionSampler File ~/anaconda3/lib/python3.11/site-packages/imblearn/combine/__init__.py:5 1 """The :mod:`imblearn.combine` provides methods which combine 2 over-sampling and under-sampling. 3 """ ----> 5 from ._smote_enn import SMOTEENN 6 from ._smote_tomek import SMOTETomek 8 __all__ = ["SMOTEENN", "SMOTETomek"] File ~/anaconda3/lib/python3.11/site-packages/imblearn/combine/_smote_enn.py:12 9 from sklearn.base import clone 10 from sklearn.utils import check_X_y ---> 12 from ..base import BaseSampler 13 from ..over_sampling import SMOTE 14 from ..over_sampling.base import BaseOverSampler File ~/anaconda3/lib/python3.11/site-packages/imblearn/base.py:21 18 from sklearn.utils.multiclass import check_classification_targets 20 from .utils import check_sampling_strategy, check_target_type ---> 21 from .utils._param_validation import validate_parameter_constraints 22 from .utils._validation import ArraysTransformer 25 class SamplerMixin(BaseEstimator, metaclass=ABCMeta): File ~/anaconda3/lib/python3.11/site-packages/imblearn/utils/_param_validation.py:908 906 from sklearn.utils._param_validation import generate_valid_param # noqa 907 from sklearn.utils._param_validation import validate_parameter_constraints # noqa --> 908 from sklearn.utils._param_validation import ( 909 HasMethods, 910 Hidden, 911 Interval, 912 Options, 913 StrOptions, 914 _ArrayLikes, 915 _Booleans, 916 _Callables, 917 _CVObjects, 918 _InstancesOf, 919 _IterablesNotString, 920 _MissingValues, 921 _NoneConstraint, 922 _PandasNAConstraint, 923 _RandomStates, 924 _SparseMatrices, 925 _VerboseHelper, 926 make_constraint, 927 validate_params, 928 ) ImportError: cannot import name '_MissingValues' from 'sklearn.utils._param_validation' (/Users/marco_local/anaconda3/lib/python3.11/site-packages/sklearn/utils/_param_validation.py) Name: imblearn Version: 0.0 Summary: Toolbox for imbalanced dataset in machine learning. Home-page: https://pypi.python.org/pypi/imbalanced-learn/ Author: UNKNOWN Author-email: UNKNOWN License: UNKNOWN Location: /Users/marco_local/anaconda3/lib/python3.11/site-packages Requires: imbalanced-learn Required-by: Note: you may need to restart the kernel to use updated packages.커널을 다시 시작해도 동일한 문제가 발생하여 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2(신 버전)
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제 지문에서알려주는 제출 CSV 파일 형식은 0, 1, 1, 0 ... 이런 predict 결과값인데0.11385 와 같이 predict_proba 확률값으로 결과를 제출해도 괜찮은 이유가 궁금합니다!roc_auc가 predict_proba 로 해야한다면 predict_proba로 모형 성능테스트를 하고 제출은 predict로 해야하는 것이 아닌가... 라는 의문이 들어서 문의드립니다
-
미해결[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
iou 계산 식 문의
안녕하세요! 너무 좋은 수업을 들을 수 있어 감사합니다!질문이 있는데요,위 코드에서 iou를 구하려면 cand_box에서와 같이 gt_box의 2,3번째 값도 x max와 y max로 바꿔줘야 하는게 아닌가요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 작업형 2번 풀이 질문있습니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요import pandas as pdtrain = pd.read_csv("train.csv")test = pd.read_csv("test.csv")# EDA# train.shape,test.shape# train.head()# train.info()# train.describe()# train.isnull().sum()# test.isnull().sum()# train['Segmentation'].value_counts()# train.describe(include='object') # 피쳐링# from sklearn.preprocessing import MinMaxScaler# cols = ['Age','Work_Experience','Family_Size']# scaler = MinMaxScaler()# train[cols] = scaler.fit_transform(train[cols])# test[cols] = scaler.transform(test[cols])# train[cols].head() train = pd.get_dummies(train)test = pd.get_dummies(test) train = train.drop('ID',axis=1)test_id = test.pop('ID')# train.head() # 검증데이터from sklearn.model_selection import train_test_splitX_tr,X_val,y_tr,y_val = train_test_split(train.drop('Segmentation',axis=1),train['Segmentation'],test_size=0.15,random_state=2023)# X_tr.shape,X_val.shape,y_tr.shape,y_val.shape # 랜덤포레스트from sklearn.ensemble import RandomForestClassifiermodel = RandomForestClassifier(random_state=2023,max_depth=8,n_estimators=800)model.fit(X_tr,y_tr)pred = model.predict(X_val) # 예측 및 평가from sklearn.metrics import f1_scoreprint(f1_score(y_val,pred,average='macro')) # 제출pred = model.predict(test)submit = pd.DataFrame({ 'ID':test_id, 'Segmentation':pred})submit.to_csv("submission.csv",index=False)# pd.read_csv("submission.csv") 수치형 데이터를 스케일링 하는 경우는 언제인가요?(minmaxscaler등을 이용하는 것)범주형 데이터 라벨 인코딩이나, 원핫인코딩 둘 중 아무거나 써도 상관없을까요?예측할 때 값이 0.7이상은 나와야 했던거 같은데 너무 작게 나오는데 괜찮나요?급하게 공부하느라 전체적인 틀을 외워서 작성하고 있는데 이정도 작성할 수 있으면 괜찮을까요? 제출하기 전에 csv생성하는 것을 제외한 모든 print문은 주석처리 해야되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요roc_auc_score만 확률predict_proba로 계산이 가능한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2(신버전) EDA 소형가전
안녕하세요! 다름이 아니라, 예시문제 작업형2(신버전) 강의를 보다가 , unique() 사용해서 Data중에 '소형가전'이 Train, Test가 다르다는 걸 알려주셨는데. 이후에 별 조치가 없는거같아서 혹시 이런 경우에는 별도의 전처리를 진행하나요? 아니면 그냥 동일하게 LabelEncoding만 하는거인지 궁금합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 5회에서 보면 원핫 인코딩 get_dummies 사용시
범주형 데이터만 별도로 나누고 해주지 않고 전체 데이터로 해 주시던데 아직 초초보... 적응 단계라 get_dummies는 전체 데이터를 두고 해 줘도 되는 건가요? 시험이 몇 일 안 남아서 초조하고.. 과연 제가 할 수 있을까 계속 불안감이 드네요 ^^;;;;
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RandomForestRegressor() 그럼 여기에서도
random_state=0 모 이런식으로 고정값을 넣어 주는게 좋겠네요 ^^
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오류
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요from sklearn.ensemble import RandomForestRegressormodel = RandomForestRegressor()model.fit(X_tr, y_tr)pred=model.predict(X_val) pd.DataFrame({'id':test_id, 'output':pred}).to_csv('00100.csv',index=False) ValueError: array length 5868 does not match index length 9779길이가 다른경우 어떻게 해결하여야 하나요? 강의 따라하는데 강의에서는 문제가 없는데 왜 그럴까요?
-
해결됨비전공자를 위한 진짜 입문 올인원 개발 부트캠프
노션링크
강의에 나오는 노션 링크는 어디에서 확인할 수 있나요?