묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회기출 작업형2에서 light GBM 적용
작업형 2에서 ligtGBM 적용시 인코딩 필요없다고 하셨는데 기출 풀이에서는 원핫 인코딩이 된 이후에 적용하신 거로 보입니다. 원핫 인코딩 후 ligt GBM을 사용해도 되는 건가요? 만약 기출풀이처럼 원핫 인코딩을 하지 않았을때는 카테고리화 작업을 한 후에 ligtht GBM을 적용하면 되는건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train, test가 3개 이상 주어질때 concat 필수여부
기출 한번씩 보고, 캐글에 올려주신 문제를 풀다가X_train, X_test, y_train, y_test이렇게 주어졌는데 concat을 까먹고X_train,X_test만 활용했습니다.*target값은 y_train.pop으로 분리함. 성능이 0.87수준으로 나쁘지않아서 그냥 지나쳤는데 뭔가 찝찝해서 생각해보니 concat으로 합치셨더라구요. 그래서 궁금한게,데이터파일이 3개이상 주어졌을때 train,test 한개씩 합치고 이후 전처리 단계 수행하는게 적합할지 질문드립니다! train = pd.concat([X_train,y_train['SalePrice']],axis=1)test = pd.concat([X_test,y_test['SalePrice']],axis=1)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장 문의드립니다.
안녕하세요.빅데이터분석기사 실기 강의를 작년에 결제했었는데 개인사정으로 시험을 못보다가 이번에 시험을 치게 됐습니다. 현재 강의가 6월 12일에 끝나는데 혹시 강의가 이번 실기 시험 전날인 6월 20일까지 연장이 가능할까 하여 문의드립니다 ㅠㅠ메일주소는 yjm7252@gmail.com 입니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
dir 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요sklearn 관련해서 코랩에서 dir 을 쓰면 엄청 많이 나오는데 실제 체험환경 들어가서 쓰니까 자주 사용하는 dir은 다 안보이더라구요 원래 이런건가요?? 아니면 체험환경에서만 제공을 안하는건지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제2유형 결측치 채우기
제2유형 결측치 채우기 어떻게 진행해야되나요? 물론 기출에는 결측치 있는 문제가 안나왔지만, 시험환경 test에는 결측치가 있었고, fillna(0)으로 했는데, 수치 차이가 많이 나는 것 같습니다. 평균치 mean() 또는중앙값 median()으로 정리하는게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ROU-AUC
ROU-AUC 쓸때요. predict_proba(test)이후에 [:,1]는 어디에붙이던 상관없나요? 저는 DataFrame에도 붙여보고, predict_proba(test)[:,1]에도 붙여봤는데 값이 똑같이 나오더라구요.from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(x_tr, y_tr) pred = rf.predict_proba(test) submit = pd.DataFrame({'pred':pred[:,1]})
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 작업형3 문제 2-1
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요9회 작업형3 문제 2-1에서 로지스틱 회귀 모형을 적합할 때 독립 변수 중MonthlyCharges (월 사용 요금)CustomerTenure (고객 유지 기간)HasPhoneService (전화 서비스 이용 여부)HasTechInsurance (기술 보험 가입 여부) HasPhoneService, HasTechInsurance는 '여부'에 대한 것이고 결과값도 0,1로 나타나니 범주형으로 간주해야 하는 것은 아닌가요?저는 이런 식으로 C()로 묶어서 적합했는데, 풀이에서는 그렇게 하지 않으셨어서, 어떻게 하는 게 맞는지 문의드립니다.from statsmodels.formula.api import logit model = logit('Churn ~ MonthlyCharges + CustomerTenure + C(HasPhoneService) + C(HasTechInsurance)', data=df).fit()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 풀 때 검증데이터 분할 vs. 교차검증
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요다름이 아니라 작업형2 풀 때 대부분은 검증데이터 분리하는 것 (홀드아웃) 으로 풀이를 해주셨는데,한 번은 교차검증으로 알려주셨는데요 챗지피티한테 제 작업형2 코드를 평가해달라고 하면 항상 교차검증을 하는 게 더 낫다고 답변을 줘서요 실제로 평가기준 점수를 비교했을 때 교차검증일 때가 평가지표가 더 높은 경우가 많았습니다.혹시 둘 중에서 아무거나 사용해도 되는지, 교차검증을 사용하는 게 나은지, 안전하게 홀드아웃 - 검증데이터 분할을 추천하시는지 여쭙습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
연습문제 풀이
책에 기재되어있는 연습문제 풀이 영상은 따로 없는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
메모장 활용 가능 여부?
안녕하세요유튜브에서 선생님 강의를 보니, 함수가 기억 안날때 dir 을 통해서 확인하는 방법을 알았습니다.그리고 구름 체험환경에서 dir(pd) 했을때 여러 함수가 출력으로 쭉 나오는걸 확인했습니다. 여기서 질문은1) 시험 볼때는 구름 안의 메모장 기능만 사용 가능한가요? 윈도우 메모장도 사용 가능한가요?2) 출력된 여러 함수들을 ctrl+c 로 복사하려고 하니 복사가 안됩니다. 마우스 우클릭해서 복사해도 되나요?3) 그리고 글자 찾기를 하기 위해 ctrl+f 를 써도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
답안 제출 후 수정 가능 여부
안녕하세요, 시험환경에서 답안 제출 후 수정 가능 여부 질문드립니다. 작업형2의 경우 여러번 제출을 해도 마지막에 제출한 코드로 채점이 된다고 이해했는데,작업형1과 작업형3은 답안을 한번 제출한 뒤에는 다시 수정할 수 없는지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기체험 환경에서 회귀 RMSE 오류
안녕하세요29강 머신러닝 학습 및 평가(회귀) 강의를 듣고 코랩에서 해보고 실습환경에서 해볼려고 실행을 하는데 그럼처럼 RMSE import에서 오류가 나네요 강의에서 실습환경이 업데이트 되어서 된다고 하셨는데 제가 뭘 잘 못한건지 모르겠네요 체크 좀 해주세요요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 중 문의드립니다!
안녕하세요! 수업 강의 잘 듣고 있습니다궁금한게 있어서 문의 남깁니다! numeric_only=True는 이번에 시험환경이 업데이트 되어, sum이나 corr 를 사용할때 붙이는 걸로 인지했습니다. 공부하던 도중에 어떤 곳은 inplace=True가 붙고 어떤 곳은 안붙어서 혹시 어느 때에 쓰면 되는지 궁금합니다! 원본 객체를 그대로 쓰며 수정하겠다는 의미 자체는 알겠는데.. df.dropna() 이런 곳에도 붙고 여기저기 붙는것같아서 명확히 알면 좋을 것 같습니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
파일 제출할 때 질문있습니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요# 5) 제출파일 생성# from sklearn.metrics import mean_squared_error# def rmse(y_true, y_pred):# return mean_squared_error(y_true, y_pred) ** 0.5# print(rmse(y_val, pred)) # pred = rf.predict(test)# submit = pd.DataFrame({'pred':pred})# submit.to_csv('result7.csv', index = False) 파일확인print(pd.read_csv('result7.csv').head(5))이렇게만 하면 자동제출 되는건가요? 아니면 따로 제가 제출하기위해서 뭔가를 클릭해줘야하는 환경인가요...? 시험환경을 잘모르겠어서 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse 값 구하기
랜덤포레스트 후 rmse 값을 구할 때 이렇게 구해도 상관없을까요?? from sklearn.ensemble import RandomForestRegressor from sklearn.metrics import mean_squared_error import numpy as np rf=RandomForestRegressor(random_state=0) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) mse=mean_squared_error(y_val,pred) rmse=np.sqrt(mse) print(rmse)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 일부 문의
단순 선형회귀 분석에서 잔차를 구할때 잔차 = df[종속변수] - model.predict(df['독립변수]) 이렇게 구하는데, 다중선형 회귀분석에서 구하는 방식인 model.resid 으로 구해도 되는지 문의드립니다. 잔차제곱 평균을 mse라고 할때 mse = (model.resid **2).mean()으로 구하는데, 마인드맵에서 잔차의 평균제곱오차 (MSE) = model.mse_resid로 나타나있는데 두 개의 값이 다르게 나오는데 혹시 다르게 나오는 이유를 알려주시면 감사하겠습니다! 작업형3 회귀분석 관련 범주형 변수일때 원핫 인코딩을 적용하게 되면 숫자로 안바뀌고 True,False로 값이 뜨는데, 이유와 어떻게 숫자로 바꿀수 있는지 알려주시면 감사하겠습니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 5회 pred값이 선생님 결과랑 달라요
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 pred1 15586.882 15407.713 14912.474 18482.735 6168.016 16953.75 기출 5회 정답파일 제출 Value값인 pred가 책이랑 다른데, 이럴수가 있나요? 제출한다면 선생님꺼랑 똑같은 인덱스에 똑같은 pred값이 들어갔어야할텐데,,, random_state도 똑같이 전부 0으로 맞췄는데 이럴수가 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 로지스틱 회귀분석
강의서에서 잔차이탈도는 model = glm(formula, data=데이터, family=sm.families.Binomial()).fit()이렇게 구하는것으로 나와있는데, 작업형3 마인드맵 자료 주신거에는로그우도 : model.lif잔차이탈도 : -2 * model.lif이렇게 되어 있는데,로그우도, 잔차이탈도 모두 logit summary에서도 확인할 수 있는것인지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 마인드맵 로지스틱 회귀분석
작업형3 마인드맵 올려주신것 중에서 로지스틱 회귀분석 관련오즈비에 대한 설명은 작업형3 예시 문제 강의에서 확인가능한데,나머지 (오류율,AIC/BIC,잔차,로그우도 등) 부분에 대한 설명은 현재 강의에서 볼 수 없는데설명해주시는 강의가 따로 있을까요??!^^
-
미해결파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
local 환경에서 수업을 진행해도 무리가 없을까요?
local 사양이 괜찮은 편이여서 그대로 진행하려고 합니다. 괜찮을련지요? 기존에 수업을 듣다가 프로그래밍에 관심이 생겨서, C언어 기본, C++ 자료구조 및 알고리즘을 제대로 학습한 후에 돌아왔습니다. 다시 수강해보겠습니다~