묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 베이스라인에서 model.fit(X_tr[cols],y_tr) 질문사항
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요예시문제 작업형2(신버전)강의 내용 17분 16초 쯤에 수치형 베이스라인으로 작업을 하실 때 아래와 같이 코딩을 하셨는데 model.fit(X_tr[cols],y_tr)pred=model.predict_proba(X_val[cols]) 이미 train_test_split 을 할때 train[cols] 을 활용해 데이터 분할을 하였기에 굳이 다시 쓰기보단 model.fit(X_tr,y_tr)pred=model.predict_proba(X_val) 이런식으로 작업을 해도 괜찮은지 여쭤보고 싶습니다. 실제로 이렇게 작업을 했을 때도 문제가 없었는데 혹시나 한번 여쭤보고 싶어 이렇게 글을 올립니다. 감사합니다:)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형에서 제출 이후에도 재제출이 가능한가요?
답안을 일단 먼저 제출하고나서, 이후에 파라미터를 수정하고 다시 파일을 제출해되 되는지 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
정답제출
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 b.sort_values(ascending = False).index[0] 위와 같이 index[0]로 추출하여 제출하지말고 눈으로 정렬된 결과를 보고 print('smoothness error')로 제출해도 괜찮나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측값 처리 관련 궁금합니다
결측값을 찾아 다른값으로 대체하는 등의 문제를 풀때 df[‘f3’].fillna(0)또는 넘파이 이용해서 df[‘f3’].replace(np.nan,0) 두개는 완전히 같은 기능인가요? 3번은 후자로 풀이해주셨는데 fillna 가능한지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train test 합쳐서 인코딩후 나누기
train, test 데이터의 범주형 카테고리가 다르다고 가정하고무조건 데이터를 합쳐서 인코딩후 다시 train, test 로 나누는 절차로시험 준비를 해볼까 생각이 드는데요선생님 의견이 궁금합니다
-
미해결[핵집] 2025 빅데이터 분석기사(실기)_작업형 1·2·3유형
강의자료 요청드립니다.
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. kum0621@naver.com 으로 자료 요청드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
동영상 강의와 똑같은 수식을 적은것 같은데 오류가 납니다.
데이터 핸들링을 위한 판다스 기초 1 동영상 강의에서 df.corr이나 car.nunique 수식을 작성할 때 에러 메세지가 뜹니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
동영상을 보면서 실습은 못하는건가요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀 rmse
회귀실습 따라하던 중 이런 오류가 떴는데 어떻게 해결해야할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
에러메세지와 마주하기 에러 4번
9분 09초영상과 노트북의 코드가 다른데요# 풀이 코드 # X_train, y_train, X_test 3개 파일이 주어졌을 때 from sklearn.datasets import load_wine wine = load_wine() df = pd.DataFrame(wine.data, columns=wine.feature_names) df['target'] = wine.target from sklearn.model_selection import train_test_split X_train, X_test, y_train, _ = train_test_split(df.drop('target',axis=1), df['target'], test_size=0.2, random_state=2022) # 만약 'proline'컬럼의 값이 1500 일때 이상치라고 판단해 삭제 했다면? print("1500이상인 데이터 수:", sum(X_train['proline'] >= 1500)) # 삭제할 데이터의 인덱스 값을 구하고 drop함수를 통해 삭제 ind = X_train[X_train['proline'] >= 1500].index print("삭제할 index:", ind) X_train = X_train.drop(ind) # 기본값 axis = 0 y_train = y_train.drop(ind) from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier() model.fit(X_train, y_train)(질문1 )X_train에 y_train를 합친뒤 이상치를 삭제하는 것보다 각각 개별로 삭제하는게 더 간단해서 수정한건가요?(질문2) df 에서 이상치를 제거한 후에 train_test_split 으로 데이터를 나눠도 되는건가요?
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 3~4
해당 Ppt 교안 자료(3~4) 요청
안녕하세요.alsrbsdl5@naver.com으로 강의 교안 발송 부탁드립니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 csv파일 제출
안녕하세요 강사님 갑자기 작업형 2유형 csv 파일 제출할때 혼동이 생겨 질문합니다다름이 아니라 시험환경 문제 풀이중 roc_acu로 평가 한다고 되어 있어 predict_proba로 예측값을 뽑아 제출하면 된다고 생각했지만 csv 제출 파일 예시에는 이렇게 나와있어 이런 경우에는 predict으로 예측값을 뽑아 제출하는건가 하여 혼동이 와 질문드립니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[7회 작업형3 문제1-3] target을 test에서 pop하는 이유를 잘 모르겠습니다
model = logit('gender ~ weight', data=train).fit() target = test.pop('gender') target = test.pop('gender') <- 이 부분에서 왜 target을 test에서 pop하는지 잘 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 채우기/ 삭제
빅분기 시험 볼때, 결측치 채우기/ 삭제에 대해서, 정리하면,결측치 채우기 : train, test data 모두 적용결측치 삭제 : train data 가능/ test data 불가능 (컬럼은 가능하나 train, test 데이트의 행(개수) 일치시켜야 함이렇게 이해한 것이 맞을까요? ^^;;
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
랜덤포레스트와 xgb
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요평가할 때rf = RandomForestClassifier()rf.fit()rf.predict()이 부분에서 rf를 다 model로 적어줘도 상관없나요? model = RandomForestClassifier()model .fit()model .predict()또한, 랜덤포레스트에서 model를 변수명으로 해서 돌리고 xgboost에서도 똑같이 model를 변수로 두고 돌려도 되는지 여쭤봅니다. 이전 강의인 회귀파트에서는 모델에 따라 변수명을 다르게 하지 않고 다 같은 model로 변수명을 두었더라구요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5-1 작업형2 모의문제1 강의 내용 질문
안녕하세요. 선생님해당 강의에서피처엔지니어링을 위해 베이스 라인(수치형 데이터만 사용해보기) 만드는 과정에서선생님께서는cols = train.select_dtypes(include="O").columnstrain = train.drop(cols, axis=1)test= test.drop(cols, axis=1)로 하셨는데요. train = train.select_dtypes(exclude="O")test = test.select_dtypes(exclude="O") 로 해도 문제 없을까요? drop() 메소드로 cols 변수에 넣은 칼럼을 axis=1 로 전부 제거한거니까그냥 범주형 데이터를 제외 시키는 select_dtypes(exclude="O") 으로 해도 문제 없을 것 같긴 한데, 확인차 질문 글 남깁니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.drop 사용시 에러 발생
선생님, df.drop("시즌", axis = 0) 으로 작성하면 에러가 안뜨지만df.drop("시즌", 0) 으로 작성하면 다음과 같은 에러메세지가 뜹니다.이유를 알 수 있을까요?|DataFrame.drop() takes from 1 to 2 positional arguments but 3 were given
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
주어진 csv파일이 2개일때와 3개일때 차이가 궁금합니다
csv 파일이 주어질때 train, test 2개 주어질때와X_train , y_train, X_test 3개 주어질때간단하게 생각하면 X_train,y_train 데이터로 나눠있는 데이터를 train으로 나누지 않고 주어졌다고 생각하면 될가요? 2개로 주어졌을때는 타겟값만 pop으로 빼내고3개일때는 train값을 합쳐서 결측치, 전처리 하면 될가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 16-1 7회 기출 유형(작업형1) 문제 2번에서
시험장에서 아래와 같이 풀이해도 괜찮을까요?loc를 사용하지 않고 df["DE14"]를 입력해서 구해도 괜찮은지 궁금합니다! # DE1~DE77컬럼 중 주가지수의 종가 "close"와 가장 상관관계가 높은 변수를 찾아 abs(df.corr()["close"]).sort_values(ascending = False) # 해당 변수의 평균값을 구하시오. (반올림하여 소수 넷째자리까지 계산) print(round(df["DE14"].mean(),4))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링 질문드립니다
안녕하세요 강사님강의 풀이 중 궁금한게 있어서 질문드립니다! 강의에서 object 타입의 대해서만 encoder 하고,int, float 타입에 대해서는 별도의 scaler 작업을 안하신 것 같은데 혹시 스케일링 작업은 필수가 아닌가요?? 성능만 잘 나오면 생략해도 무방한가요?