묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 질문
위 화면은 선생님이 풀이해주신거고아래는 제가 작성한 코드입니다. # your code import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") # print(df.isnull().sum()) # print(df.shape) df=df.dropna(subset=['views']) # print(df.shape) df['f3']=df['f3'].map({'silver':1,'gold':2,'vip':3}) df['f3']=df['f3'].fillna(0) int(sum(df['f3'])) 결측치 처리를 할때선생님은 numpy 라이브러리를 통해replace(np.nan,0) 을 사용했습니다. 저는 아래와 같이 실버,골드,vip를 맵핑해준 후, 결측치를 0으로 처리했습니다.df['f3']=df['f3'].map({'silver':1,'gold':2,'vip':3}) df['f3']=df['f3'].fillna(0) 질문1) 위와 같이 결측치 따로, 맵핑 따로 작성 해도 되나요? 총계합은 동일하게 나오면 상관없나요? 질문2) 위 코드에서 제가 처음에는 결측치를 먼저 처리하고 맵핑을 했더니, 맵핑한 이후에는 0으로 처리했던 결측치가 다시 NaN 이 되어서 작성 순서를 맵핑 후 결측치 처리로 변경했는데.. 왜 그런건가요? 순서에 따라 결과가 달랐습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
잔차 계산할떄
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요관측값 - 예측값이 잔차인데df['키] - model.predict(df['몸무게']) 인 이유가 어떤건가요?? 종속변수가 실제값이고 독립변수가 예측값이라고 생각하고 하면 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[기출문제 4회] 질문드립니다.
제출 형식:ID,Segmentation 458989,1 458994,2 459000,3 459003,4이렇게 되어 있습니다.한가지 방법으로 풀기 진행시 pred = rf.predict(test)submit = pd.DataFrame({'ID' : ???, 'pred' : pred})???를 어떻게 처리해야 하나요?저는 # ID, 예측값: Segmentation test_id = train.pop('ID') target = train.pop('Segmentation') ~~ pred = rf.predict(test) submit = pd.DataFrame({'ID' : test_id,'pred' : pred})마지막 줄 코드에서 에러가 발생합니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스 - 파이썬 질문
판다스 수강중입니다.문득 궁금한게, 판다스 데이터 프레임 함수 활용시df.sum() 등이 있는데요그냥 sum(df['f1']=='gold') 도 있던데, 파이썬 함수형태로도 작성해도 시험에서 문제없나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 예시문제에
import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")print(train.shape) 출력값이 (3500,10)으로성별컬럼이 안나오는데 왜그런건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 다중분류 문제 roc_auc 적용가능 문의
작업형2 다중분류 문제에서예측할 컬럼: 농약검출여부 (0:미검출, 1:검출, 2:재검사 필요) 일때, roc_auc_score는 적용할 수 없는지 문의드립니다. 예를 들면 이진분류에서는 pred[ : , 1]로 설정을 하게 되는데,다중분류 문제에서 농약검출여부 중 어떤 결과값을 물어보지 않게 되면pred [ : , 0 또는 1또는 2]를 적용할 수 없어 roc_auc는 사용할 수가 없는 것인지 궁금합니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회기출 작업형2에서 light GBM 적용
작업형 2에서 ligtGBM 적용시 인코딩 필요없다고 하셨는데 기출 풀이에서는 원핫 인코딩이 된 이후에 적용하신 거로 보입니다. 원핫 인코딩 후 ligt GBM을 사용해도 되는 건가요? 만약 기출풀이처럼 원핫 인코딩을 하지 않았을때는 카테고리화 작업을 한 후에 ligtht GBM을 적용하면 되는건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train, test가 3개 이상 주어질때 concat 필수여부
기출 한번씩 보고, 캐글에 올려주신 문제를 풀다가X_train, X_test, y_train, y_test이렇게 주어졌는데 concat을 까먹고X_train,X_test만 활용했습니다.*target값은 y_train.pop으로 분리함. 성능이 0.87수준으로 나쁘지않아서 그냥 지나쳤는데 뭔가 찝찝해서 생각해보니 concat으로 합치셨더라구요. 그래서 궁금한게,데이터파일이 3개이상 주어졌을때 train,test 한개씩 합치고 이후 전처리 단계 수행하는게 적합할지 질문드립니다! train = pd.concat([X_train,y_train['SalePrice']],axis=1)test = pd.concat([X_test,y_test['SalePrice']],axis=1)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장 문의드립니다.
안녕하세요.빅데이터분석기사 실기 강의를 작년에 결제했었는데 개인사정으로 시험을 못보다가 이번에 시험을 치게 됐습니다. 현재 강의가 6월 12일에 끝나는데 혹시 강의가 이번 실기 시험 전날인 6월 20일까지 연장이 가능할까 하여 문의드립니다 ㅠㅠ메일주소는 yjm7252@gmail.com 입니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
dir 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요sklearn 관련해서 코랩에서 dir 을 쓰면 엄청 많이 나오는데 실제 체험환경 들어가서 쓰니까 자주 사용하는 dir은 다 안보이더라구요 원래 이런건가요?? 아니면 체험환경에서만 제공을 안하는건지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제2유형 결측치 채우기
제2유형 결측치 채우기 어떻게 진행해야되나요? 물론 기출에는 결측치 있는 문제가 안나왔지만, 시험환경 test에는 결측치가 있었고, fillna(0)으로 했는데, 수치 차이가 많이 나는 것 같습니다. 평균치 mean() 또는중앙값 median()으로 정리하는게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ROU-AUC
ROU-AUC 쓸때요. predict_proba(test)이후에 [:,1]는 어디에붙이던 상관없나요? 저는 DataFrame에도 붙여보고, predict_proba(test)[:,1]에도 붙여봤는데 값이 똑같이 나오더라구요.from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(x_tr, y_tr) pred = rf.predict_proba(test) submit = pd.DataFrame({'pred':pred[:,1]})
-
미해결dbt, 데이터 분석 엔지니어링의 새로운 표준
DW의 star-schema 생성
(질문전 반드시 AI-assitant와 먼저 해결해보세요!)1. 이 문제를 해결해보기 위해 어떤 시도를 해보셨나요?2. 질문 내용만 보았을 때, 답변자가 질문의 의도를 쉽게 이해할 수 있는 컨텍스트가 다 들어있나요? (영상 xx:yy ~ zz:aa 부분, 시도해본 작동하는 전체 코드 등) 안녕하세요! dbt 강의 너무 재미있게 공부하고있습니다.미국에서 공부하고 있어 dbt가 얼마나 강력하고 많은 곳에서 원하는지 몸으로 체감하고 있습니다.혹시 궁금한 부분이 기존 ETL의 경우 Transform단에서는 데이터 전처리, 타입 변환 등이 수행되고 DW staging db 단에 load 된 후에 여기서 table간의 조인 등의 처리로 Star-schema (Fact, dimension tables) 이 개발되는 것으로 알고 있습니다.dbt의 경우 말씀해주신대로 ELT 방식으로 DW로 load된 후에 Transform되는 방식인데요.dbt가 그럼 Star-schema (Fact, dimension tables) 개발를 개발하는 단계에도 관여를 하는 걸로 이해하면될까요? (e.g. BIgQuery에서 개발되는 것이 아닌 dbt 상에서 개발하게 되는지)답변 주시면 감사하겠습니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 작업형3 문제 2-1
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요9회 작업형3 문제 2-1에서 로지스틱 회귀 모형을 적합할 때 독립 변수 중MonthlyCharges (월 사용 요금)CustomerTenure (고객 유지 기간)HasPhoneService (전화 서비스 이용 여부)HasTechInsurance (기술 보험 가입 여부) HasPhoneService, HasTechInsurance는 '여부'에 대한 것이고 결과값도 0,1로 나타나니 범주형으로 간주해야 하는 것은 아닌가요?저는 이런 식으로 C()로 묶어서 적합했는데, 풀이에서는 그렇게 하지 않으셨어서, 어떻게 하는 게 맞는지 문의드립니다.from statsmodels.formula.api import logit model = logit('Churn ~ MonthlyCharges + CustomerTenure + C(HasPhoneService) + C(HasTechInsurance)', data=df).fit()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 풀 때 검증데이터 분할 vs. 교차검증
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요다름이 아니라 작업형2 풀 때 대부분은 검증데이터 분리하는 것 (홀드아웃) 으로 풀이를 해주셨는데,한 번은 교차검증으로 알려주셨는데요 챗지피티한테 제 작업형2 코드를 평가해달라고 하면 항상 교차검증을 하는 게 더 낫다고 답변을 줘서요 실제로 평가기준 점수를 비교했을 때 교차검증일 때가 평가지표가 더 높은 경우가 많았습니다.혹시 둘 중에서 아무거나 사용해도 되는지, 교차검증을 사용하는 게 나은지, 안전하게 홀드아웃 - 검증데이터 분할을 추천하시는지 여쭙습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
연습문제 풀이
책에 기재되어있는 연습문제 풀이 영상은 따로 없는건가요?
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
9회 복원 링크 있으신지요
넵 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
메모장 활용 가능 여부?
안녕하세요유튜브에서 선생님 강의를 보니, 함수가 기억 안날때 dir 을 통해서 확인하는 방법을 알았습니다.그리고 구름 체험환경에서 dir(pd) 했을때 여러 함수가 출력으로 쭉 나오는걸 확인했습니다. 여기서 질문은1) 시험 볼때는 구름 안의 메모장 기능만 사용 가능한가요? 윈도우 메모장도 사용 가능한가요?2) 출력된 여러 함수들을 ctrl+c 로 복사하려고 하니 복사가 안됩니다. 마우스 우클릭해서 복사해도 되나요?3) 그리고 글자 찾기를 하기 위해 ctrl+f 를 써도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
답안 제출 후 수정 가능 여부
안녕하세요, 시험환경에서 답안 제출 후 수정 가능 여부 질문드립니다. 작업형2의 경우 여러번 제출을 해도 마지막에 제출한 코드로 채점이 된다고 이해했는데,작업형1과 작업형3은 답안을 한번 제출한 뒤에는 다시 수정할 수 없는지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기체험 환경에서 회귀 RMSE 오류
안녕하세요29강 머신러닝 학습 및 평가(회귀) 강의를 듣고 코랩에서 해보고 실습환경에서 해볼려고 실행을 하는데 그럼처럼 RMSE import에서 오류가 나네요 강의에서 실습환경이 업데이트 되어서 된다고 하셨는데 제가 뭘 잘 못한건지 모르겠네요 체크 좀 해주세요요