묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 6회 작업형1 문제 3번datetime
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요6회 기출유형(작업형1) 강의에서 3번 문제를 풀 때 '날짜' 컬럼을 pd.to_datetime을 통해서 풀려면 코드 작성을 어떤 식으로 진행해야 할지 알려주시면 감사하겠습니다 ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제2 문제4
자료형 삭제할 때방법3로 해도 되나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 강의 계획
안녕하세요, 강사님어쩌다 보니 실기 시험 준비 기간이 좀 늦어 졌는데,지금 시험까지 약 10일 정도 밖에 남지 않은 상황인데, 지금부터 시작한다면 어떤식으로 학습하는게 좋을까요?ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형 2(ver. 2025) rmse 문의드립니다.
train['환불금액'] = train['환불금액'].fillna(train['환불금액'].median())test['환불금액'] = test['환불금액'].fillna(test['환불금액'].median())train = train.drop('회원ID', axis=1)target = train.pop('총구매액')test_id = test.pop('회원ID')cols = train.select_dtypes(include ='O').columnsdf = pd.concat([train, test])from sklearn.preprocessing import LabelEncoderfor col in cols: le = LabelEncoder() # train[col] = le.fit_transform(train[col]) # test[col] = le.transform(test[col]) df[col] = le.fit_transform(df[col])# df = pd.get_dummies(df[cols])train = df[:len(train)]test = df[len(train):]from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train,target,test_size = 0.2,random_state=0)# from sklearn.ensemble import RandomForestRegressor# rf = RandomForestRegressor(random_state=0, max_depth=5, n_estimators=500)# rf.fit(X_tr,y_tr)# pred = rf.predict(X_val)from xgboost import XGBRegressorxgb = XGBRegressor(random_state=0, max_depth=5, n_estimators=400, learning_rate=0.01)xgb.fit(X_tr, y_tr)pred = xgb.predict(X_val)from sklearn.metrics import mean_squared_error, r2_scoremse = mean_squared_error(y_val, pred)rmse = mse**(1/2)r2 = r2_score(y_val, pred)print(mse, rmse, r2) 이렇게 작성했을때 이렇게 나오는데 잘된게 맞는건지 아닌건지 모르겠습니다. 선생님께서는 레이블 인코딩했을때 rmse가 813.22가 나오셨다는데 왜이렇게 차이가 많이나는지 모르겠습니다. 672765.0076766363 820.2225354601252 0.7020188276193622
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1의 모의문제2번에 문제4번 풀이 질문 드립니다
작업형1의 모의문제2번에 문제4번 질문입니다문제4주어진 데이터에서 자료형(type)이 object인 컬럼은 삭제하고, 결측치는 0으로 대체한다.행 단위로 합한 다음 그 값이 3000보다 큰 값의 데이터 수를 구하시오 ('age', 'f1', 'f2', 'f5', 'views'의 각 행별 합)에서 두번째 라인의 행단위로 합한다음 그값이 3000 보다 큰 값의 데이타 수를 구하라 것으로 문제풀이는 아래와 같습니다 cols = df.select_dtypes(exclude='object').columnscolsdf = df[cols]df.head()df = df.fillna(0)df = df.Tdf.head()print(sum(df.sum() > 3000))여기서 질문이 문제에서 행단위로 합한다음 그 값이 3000보다 큰 데이타 수를 구하라는 의미는 단순한 워딩만 분석해 보면 아래 처리 이해 됩니다. 즉 , age f1 ... 등등의 행의 합을 구하고 그 값이 3000이 넘는 수가 몇개냐의 의미로 해석되됩니다. 선생님의 문제 풀이가 이해가 안가는데 설명 좀 부탁드립니다, cols = df.select_dtypes(exclude="object").columnscolsdf = df[cols]df = df.fillna(0)df = df.Tdf['tot'] = df.sum(axis=1)print(df['tot'])(df['tot'] > 3000).sum()학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨빅데이터분석기사 실기 R 올인원: 3주에 끝내는 완벽 대비
제6회 기출복원문제 제2유형
제6회 기출복원문제 제2유형에서 enrollee_id 변수도 불필요한 값으로 간주하고 삭제해도 될까요? 또한 팩터로 변환한 변수의 level을 확인해보면(enrolled_university, education_level 등) 공백 문자값이 많이 보입니다. 해당 값들에 대해서도 제거 처리 없이 진행해도 되는지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
from sklearn.metrics import SCORERS import오류 발생
위와 같이 SCORERS를 import할때 오류가 발생합니다. 코랩환경입니다. 오류 해결 방법이 있을까요?
-
해결됨<머신러닝, 핵심만 빠르게!> 완독 챌린지
리디북스에서는 책이 안나오나요?
안녕하세요 강사님전자책 구매할려고 하는데 전자책은 주로 리디북스에서 많이 사다보니 리디에서 살려고 했는데 리디에서는 판매계획이 없으신가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
귀무가설/대립가설 설정이 헷갈립니다.
[문제] 빅데이터 분석기사 실기 언어 선택에 따라 합격 여부를 조사한 결과이다. 언어와 합격 여부는 독립적인가? 가설검정을 실시하시오. (유의수준 0.05) 귀무가설(H0): 언어와 합격 여부는 독립이다. 대립가설(H1): 언어과 합격 여부는 독립이지 않다. 여기서, 이 문제는 독립성 검정이기 때문에 귀무가설은 독립이다! 라고 설정하는건가요? 보통 귀무가설이 알려진 사실, 대립가설이 내가 증명하고자 하는 사실인데, 독립성 검정이기에...내가 증명하고자 하는 사실이 "두 데이터는 독립이다."라서 이게 대립가설인것같이 느껴집니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1에 정답
정답이 f1인데, 풀이에 반드시 print문까지 작성해야 답인가요? df.isnull().sum()을 사용하면 눈으로 f1이 답인걸 알 수 있으니 그냥 정답란에 f1만 적으면 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 관련 질문입니다.
안녕하세요,혹시 빅분기 실기 1유형 문제가 큰 문제 하나 안에서 작은 문제 3개로 구성되는 형태인가요? 이게 문제 구성이 고정적인건지 시험에 따라서 소문제가 2개나 4개로 바뀌어서 나올 수도 있는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1_모의문제1_문제1
왜 값이 다른지 여쭤봅니다 잘못작성된 것이 있을까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 문제 3번_형변환
강의랑 똑같이 코딩한것 같은데 왜 답이 float형으로 나오는 걸까요???
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
단일표본검정(wilcoxon검정)
stats.wilcoxon(df['무게']-120, alternative = 'less')에서 alternative = 'less'가 이해가 안됩니다.관측값(실제값)이 왜 더 작아야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 연습문제 섹션 3 질문
섹션3. 항공권 가격 예측 시, 탐색적 데이터 분석과정에서 describe로 unique 카테고리가 동일하지 않다면 이 강의에서는 데이터를 삭제시켰는데, 삭제시키지 않고, df = pd.concat([train, test])df = pd.get_dummies(df)train = df.iloc[:len(train)]test = df.iloc[len(train):] 이 과정을 사용해도 괜찮나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
84강 csv파일 링크
시험환경의 문제가 변경되었는지 파일을 찾을수없습니다. 어떻게 하면 될까요?
-
미해결파이썬으로 시작하는 머신러닝+딥러닝(sklearn을 이용한 머신러닝부터 TensorFlow, Keras를 이용한 딥러닝 개발까지)
boston 데이터가 없다구요
실습파일에도 csv파일은 하나도없는데 왜자꾸 똑같은 답변만 다세요 돈주고 산 강의인데 이게 뭔가요
-
해결됨[완독 챌린지] 『AI 엔지니어링』 5주만에 함께 읽기!
진도율 업데이트
진도율이 업데이트되지 않습니다. 어떻게 해야 진도율 업데이트가 될까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
연습문제 3형도 ~~
바쁘시겠지만 올려주시면 감사하겠습니다 ㅠㅠ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f1_score
안녕하세요 항상 강의 잘 보고있습니다 몇가지 궁금한게 생겨서 질문하고싶은데 전에 강의 들을때 f1스코어 에서 pos_label을 붙이셨던걸 봤는데 이걸 붙이고 안붙이고는 어떻게 판별해야 할까요?from sklearn.metrics import f1_scoref1= f1_score(y_val, pred[:,1], pos_label='>50K') average=macro는 왜 붙이는건지 알수 있을까요? 혹시 macro나 pos_label처럼 뒤에 따로 붙여야 하는 평가지표가 있다면 또 알려주실수 있을까요?감사합니다