묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ROU-AUC
ROU-AUC 쓸때요. predict_proba(test)이후에 [:,1]는 어디에붙이던 상관없나요? 저는 DataFrame에도 붙여보고, predict_proba(test)[:,1]에도 붙여봤는데 값이 똑같이 나오더라구요.from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(x_tr, y_tr) pred = rf.predict_proba(test) submit = pd.DataFrame({'pred':pred[:,1]})
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 작업형3 문제 2-1
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요9회 작업형3 문제 2-1에서 로지스틱 회귀 모형을 적합할 때 독립 변수 중MonthlyCharges (월 사용 요금)CustomerTenure (고객 유지 기간)HasPhoneService (전화 서비스 이용 여부)HasTechInsurance (기술 보험 가입 여부) HasPhoneService, HasTechInsurance는 '여부'에 대한 것이고 결과값도 0,1로 나타나니 범주형으로 간주해야 하는 것은 아닌가요?저는 이런 식으로 C()로 묶어서 적합했는데, 풀이에서는 그렇게 하지 않으셨어서, 어떻게 하는 게 맞는지 문의드립니다.from statsmodels.formula.api import logit model = logit('Churn ~ MonthlyCharges + CustomerTenure + C(HasPhoneService) + C(HasTechInsurance)', data=df).fit()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 풀 때 검증데이터 분할 vs. 교차검증
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요다름이 아니라 작업형2 풀 때 대부분은 검증데이터 분리하는 것 (홀드아웃) 으로 풀이를 해주셨는데,한 번은 교차검증으로 알려주셨는데요 챗지피티한테 제 작업형2 코드를 평가해달라고 하면 항상 교차검증을 하는 게 더 낫다고 답변을 줘서요 실제로 평가기준 점수를 비교했을 때 교차검증일 때가 평가지표가 더 높은 경우가 많았습니다.혹시 둘 중에서 아무거나 사용해도 되는지, 교차검증을 사용하는 게 나은지, 안전하게 홀드아웃 - 검증데이터 분할을 추천하시는지 여쭙습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
연습문제 풀이
책에 기재되어있는 연습문제 풀이 영상은 따로 없는건가요?
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
9회 복원 링크 있으신지요
넵 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
메모장 활용 가능 여부?
안녕하세요유튜브에서 선생님 강의를 보니, 함수가 기억 안날때 dir 을 통해서 확인하는 방법을 알았습니다.그리고 구름 체험환경에서 dir(pd) 했을때 여러 함수가 출력으로 쭉 나오는걸 확인했습니다. 여기서 질문은1) 시험 볼때는 구름 안의 메모장 기능만 사용 가능한가요? 윈도우 메모장도 사용 가능한가요?2) 출력된 여러 함수들을 ctrl+c 로 복사하려고 하니 복사가 안됩니다. 마우스 우클릭해서 복사해도 되나요?3) 그리고 글자 찾기를 하기 위해 ctrl+f 를 써도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
답안 제출 후 수정 가능 여부
안녕하세요, 시험환경에서 답안 제출 후 수정 가능 여부 질문드립니다. 작업형2의 경우 여러번 제출을 해도 마지막에 제출한 코드로 채점이 된다고 이해했는데,작업형1과 작업형3은 답안을 한번 제출한 뒤에는 다시 수정할 수 없는지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기체험 환경에서 회귀 RMSE 오류
안녕하세요29강 머신러닝 학습 및 평가(회귀) 강의를 듣고 코랩에서 해보고 실습환경에서 해볼려고 실행을 하는데 그럼처럼 RMSE import에서 오류가 나네요 강의에서 실습환경이 업데이트 되어서 된다고 하셨는데 제가 뭘 잘 못한건지 모르겠네요 체크 좀 해주세요요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 중 문의드립니다!
안녕하세요! 수업 강의 잘 듣고 있습니다궁금한게 있어서 문의 남깁니다! numeric_only=True는 이번에 시험환경이 업데이트 되어, sum이나 corr 를 사용할때 붙이는 걸로 인지했습니다. 공부하던 도중에 어떤 곳은 inplace=True가 붙고 어떤 곳은 안붙어서 혹시 어느 때에 쓰면 되는지 궁금합니다! 원본 객체를 그대로 쓰며 수정하겠다는 의미 자체는 알겠는데.. df.dropna() 이런 곳에도 붙고 여기저기 붙는것같아서 명확히 알면 좋을 것 같습니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
파일 제출할 때 질문있습니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요# 5) 제출파일 생성# from sklearn.metrics import mean_squared_error# def rmse(y_true, y_pred):# return mean_squared_error(y_true, y_pred) ** 0.5# print(rmse(y_val, pred)) # pred = rf.predict(test)# submit = pd.DataFrame({'pred':pred})# submit.to_csv('result7.csv', index = False) 파일확인print(pd.read_csv('result7.csv').head(5))이렇게만 하면 자동제출 되는건가요? 아니면 따로 제가 제출하기위해서 뭔가를 클릭해줘야하는 환경인가요...? 시험환경을 잘모르겠어서 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse 값 구하기
랜덤포레스트 후 rmse 값을 구할 때 이렇게 구해도 상관없을까요?? from sklearn.ensemble import RandomForestRegressor from sklearn.metrics import mean_squared_error import numpy as np rf=RandomForestRegressor(random_state=0) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) mse=mean_squared_error(y_val,pred) rmse=np.sqrt(mse) print(rmse)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 일부 문의
단순 선형회귀 분석에서 잔차를 구할때 잔차 = df[종속변수] - model.predict(df['독립변수]) 이렇게 구하는데, 다중선형 회귀분석에서 구하는 방식인 model.resid 으로 구해도 되는지 문의드립니다. 잔차제곱 평균을 mse라고 할때 mse = (model.resid **2).mean()으로 구하는데, 마인드맵에서 잔차의 평균제곱오차 (MSE) = model.mse_resid로 나타나있는데 두 개의 값이 다르게 나오는데 혹시 다르게 나오는 이유를 알려주시면 감사하겠습니다! 작업형3 회귀분석 관련 범주형 변수일때 원핫 인코딩을 적용하게 되면 숫자로 안바뀌고 True,False로 값이 뜨는데, 이유와 어떻게 숫자로 바꿀수 있는지 알려주시면 감사하겠습니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 5회 pred값이 선생님 결과랑 달라요
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 pred1 15586.882 15407.713 14912.474 18482.735 6168.016 16953.75 기출 5회 정답파일 제출 Value값인 pred가 책이랑 다른데, 이럴수가 있나요? 제출한다면 선생님꺼랑 똑같은 인덱스에 똑같은 pred값이 들어갔어야할텐데,,, random_state도 똑같이 전부 0으로 맞췄는데 이럴수가 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 로지스틱 회귀분석
강의서에서 잔차이탈도는 model = glm(formula, data=데이터, family=sm.families.Binomial()).fit()이렇게 구하는것으로 나와있는데, 작업형3 마인드맵 자료 주신거에는로그우도 : model.lif잔차이탈도 : -2 * model.lif이렇게 되어 있는데,로그우도, 잔차이탈도 모두 logit summary에서도 확인할 수 있는것인지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 마인드맵 로지스틱 회귀분석
작업형3 마인드맵 올려주신것 중에서 로지스틱 회귀분석 관련오즈비에 대한 설명은 작업형3 예시 문제 강의에서 확인가능한데,나머지 (오류율,AIC/BIC,잔차,로그우도 등) 부분에 대한 설명은 현재 강의에서 볼 수 없는데설명해주시는 강의가 따로 있을까요??!^^
-
미해결
fillna 방식 문의
안녕하세요. 빅분기 교재를 구입해서 연습문제를 풀어보고있는데요p164df['view'].fillna(min,inplace=True) 라고 풀이에 되어있는데결측치를 원본에서 직접수정하는 코드라 그런건지코랩에서 오류가 나기도 하고 이 문장 대신 시험에서df['view'] = df['view'].fillna(min)으로 써도 무방한건지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경test 제2유형
강사님 안녕하세요.강사님께서 말씀해주신 랜포 + train, test = train.align(test, join='left', axis=1) 하고나서에러메시지가 뜨길래 추가적인 fillna(0)를 해주고, 아래와 같이 작성했는데요 문제에서 제시한 예시와 제 답안의 수치가 너무 차이가 많이납니다.어떤부분이 문제일까요? ㅜ_ㅠ 확인 부탁드립니다.isnull 에 무조건 0채우라고해서 fillna(0)한거밖에 차이가 없습니다. import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")# print(train.info())# print(test.info())train = train.fillna(0)test = test.fillna(0)# df.isnull().sum()target = train.pop('총구매액')train = pd.get_dummies(train)test = pd.get_dummies(test)train, test = train.align(test, join='left', axis=1)train = train.fillna(0)test = test.fillna(0)from sklearn.model_selection import train_test_splitx_tr, x_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegressor(random_state=0)rf.fit(x_tr, y_tr)pred = rf.predict(test)submit = pd.DataFrame({'pred':pred})submit.to_csv('result.csv', index=False)ans = pd.read_csv('result.csv')print(ans) 저장
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형1(ver. 2025)
예시문제 작업형1(ver.2025) 문제풀어보니강의내용과 실제 데이터 시험환경 금액이 다릅니다. 체험유형사이트가 data를 업데이트 한것 같은데 맞나요? 아니면 제가 지금 잘못풀어낸건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2, 작업형3 pd.get_dummies시 drop_first 유무
작업형2 할때는 pd.get_dummies(df) 할때 drop_first가 들어가지 않았었는데 작업형3 강의에서는다중공선성을 피하기 위해pd.get_dummies(df, drop_first=True)넣으라고 되어있는데 각 유형별로 저렇게 나눠서 꼭 해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
궁금한게있습니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요2개의 파일, 3개의 파일도 연습해봐야 한다고 말씀하셨는데 시험에서 train, test 데이터 외에 다른 파일이 있을수도 있다는 말씀이신건가요?? 만약 그렇다면 어떤식으로 데이터를 나눠야하고 그래야하는지 잘 모르겠습니다 ㅜㅜ 추가로 마지막에 y_test 데이터는 따로 만들어야하는 데이터인지도 궁금하구요 추가로 랜덤포레스트랑 lightgbm 말고 xgboost 도 꼭 알아야 하는건가요?