묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 데이터 및 범주형 데이터 분리
안녕하세요 선생님수치형 데이터(n_train, n_test)와 범주형 데이터(c_train, c_test)를 분리하여 처리하는 이유가 있을까요? 분리했다가 합치는게 직관적으로 잘 이해가 안되어서요. X_train[cols] 또는 X_test[cols]로 처리하면 안되나요?아 그리고 train data만 fit_transform하고 test data는 transform만 하는 자세한 이유도 궁금합니다. 아직 학습 모델링 적용 전에 전처리 하는 과정에서도 학습을 하는건가요? (수치형만 학습, 범주형 중 원핫인코딩은 학습이 없는 것도 이유가 궁금합니다. )미리 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 1번 궁금합니다.
앞에서부터 70% 데이터 중 views 컬럼의 3사분위 수에서 1사분위 수를 뺀 값을 구하시오 라고 한다면, df = df[:int(len(df) * 0.7)]는 슬라이싱이라 끝 값이 포함 안되지 않나요,,? df2 = df.loc[:int(len(df) * 0.7)] 이렇게 되어야 하지 않나 해서 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모의 문제 3 관련하여 문의드립니다.
해당문제에서 trian과 test에서 id값을 전처리 과정에서 삭제하였는데, 아래 사진처럼 향후 예측모델 생성 시에, id 값도 예측하기 위해서 삭제한거라고 생각하면 되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝 2강 데이터 불러오기
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 데이터 불러오면 name 'pd' is not defined 라고 에러메세지가 뜨는데 뭐가 문제인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
랜덤포레스트 rf.fit 과정에서 오류가 나와요.
첫번째 시도 두번째 시도딱 rf.fit(X_tr, y_tr) 이 부분에서 에러메시지가 뜨는데 두 가지 시도 전부 다 해도 문제네요.도저히 에러를 고칠 수 없어서 문의드려요.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 시험에서 sql라이브러리 사용
안녕하세요 선생님 질문이 있어서 글남겨요 혹시 실기 시험에서 1유형 풀이시 sql라이브러리를 사용해서 풀어도 되나요? 제가 sql이 매우 익숙한 사람이여서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
object 컬럼명 선택
그냥 object라고 쓸 때가 있고 ""붙이는 경우도 있는데, 이 차이가 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코랩 문서팝업 지우는 방법
안녕하세요.강의와 교재로 학습중입니다.코랩 환경에서 자꾸 문서 팝업이 떠서 불편하여 구글링을 해보았는데도 잘 안나와서혹시 방법을 아실까 하여 질문드립니다.사진과 같이 ( 를 칠때 이와 관련된 안내문서 창이 나타나는데, 이걸 안나타나게 하는 방법이 있을까요? 답변에 미리 감사드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f3컬럼의 결측치 관련질문
선생님 해설에 보면 f3컬럼의 결측치를 replace로 활용하여 0으로 바꿀때 import numpy as npdf['f3'] = df['f3'].replace(np.nan,0)라고 되어있는데 제가 캡쳐한 화면처럼 풀어도 상관이 없는걸까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라이브러리 및 데이터 불러오기 그리고 EDA, 남성 중 0과 1 (인원 수)
강의 15:40 정도 보면 # 남성 중 0과 1 (인원수) 부분에서 코드를 똑같이 입력했는데 저는 뒤에 값이 0이 나옵니다... 뭐가 잘못된건가요,,?는
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part2
수업 질문 있습니다!
안녕하세요. 수업 너무 잘 듣고 있습니다.리밸런싱 코드는 주식을 구매할 때 당일 종가를 기준으로 구매하는건가요? 전날의 종가를 기준으로 한다면 shift함수를 써주면 될까요? 월초로 리밸런싱을 하게 된다면 keep="first"만 바꿔주면 될까요? 감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
원핫 인코딩을 했는데 0,1 이 아닌 true false 가 나오는 이유가 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
X_train
X_train['age']가 아니라 X_train[X_train['age'] 인 이유가 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
drop , dropna
이 둘의 차이는 뭘까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 컬럼 리스트화
수치형 컬럼들 리스트로 만들 시,cols = list(X_train.columns[X_train.dtypes != 'object']) 시험에서 이렇게 해도 되나요? object랑 int랑 float 세개만 나오면 이렇게 해도 될 듯한데,그 외 변수들이 나올 경우 대비해서, 수치형 컬럼들만 리스트 할 때, 어떤식으로 코딩하는 것이 나을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train 분리
[0,-1]인 이유에 대해 잘 이해하지 못하겠어요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 처리(fillna(method = 'bfill')) 질문입니다.
시험환경에서 fillna(method = 'bfill')를 사용했더니, 아래 에러코드가 발생해서 gpt로 확인했더니,train['컬럼명'] = train['컬럼명'].bfill()로도 사용할 수 있더라구요.시험환경에서 이러한 에러코드가 발생했으니 실제 시험에서도 이렇게 사용해도 상관 없을까요 ? 에러코드 전문/goorm/Main.out:12: FutureWarning: Series.fillna with 'method' is deprecated and will raise in a future version. Use obj.ffill() or obj.bfill() instead. train['abc'] = train['abc'].fillna(method = 'bfill')
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 문제6
안녕하세요. 소수점 나이를 제거하라고 되어 있는데이 부분을 소수점(실수형)->정수형으로 변환하도록df1['age'] = df1['age'].astype(int)라고 쓰면 틀린 답안이 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
predict_proba에서 기초적인 것이 늘 헷갈립니다 ㅠㅠ
roc_auc_score 평가지표에서만 predict_proba[:,1]을 통하여 예측하는 것이라고 알고 있는데뒤에 1과 0을 넣는 것이 늘 헷갈려서 개념이 잘 정립되질 않습니다.양성일 확률이 주로 1, (ex. 심장마비에 걸릴 확률이 높은 사람은?) 첫번째 클래스가 1... 근데 이번 문제 같은 경우는 정시에 도착할 경우가 0으로 배정 됐으니 predict_proba[:,0]으로 하는게 아닌지 자꾸 헷갈립니다...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 3번
문제 3번을 다음과 같은 코드로 풀었는데 오류가 발생합니다. # your code import pandas as pd import numpy as np df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") df = df.dropna(subset='views') df = df['f3'].replace({np.nan:0,'silver':1,'gold':2,'vip':3}) print(df['f3'].sum())마지막 print 에서 KeyError : 'f3' 오류가 발생했는데 무엇이 문제인가요..?