묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱 회귀 데이터 누락 관련 질문
안녕하세요! 이번에 빅분기 실기 대비로 선생님 교재와 인강 모두 사용해서 공부중에 데이터 관련하여 문의 드립니다. health_survey2.csv가 있어야 lifestyle 관련 분석이 가능할것같은데 현재 책에 적힌 깃허브에는 health_survey1.csv밖에 없는것같습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간 연장 문의드립니다.
안녕하세요. 작년 11회 시험에서 5점차이로 아쉽게 떨어지고다가오는 6월 20일 실기시험을 다시 준비하고 있습니다. 현재 수강기간이 일주일도 남지 않은 상황인데 혹시수강기간 연장 또는 부분결제 가능여부에 대해서 정중히 문의 드립니다.제 메일 주소는 hyoki97@naver.com 입니다. 항상 건강하시고 좋은 하루보내세요감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 - 연습문제 1번 관련 질문입니다.
'f5' 칼럼이 0이 아닌 데이터(행)를 구하시오-> 0이 아닌 칼럼을 제거하라는 말은 아니었다고 판단했는데요,(그래서 아래 코드로 0이 아닌 칼럼의 수를 구했습니다.)cond = df['f5'] !=0 sum(cond) 문제는 이해할 수 있으나, 향후 이렇게 문제 해석 상의 판단에 따라 정답이 달라지는 경우가 자주 발생할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 자료 16~39 관련
작업형 1 연습문제 자료에 16~39는 문제 없이 코드만 적혀있는데 그냥 코드 학습 용으로만 쓰는건가요? 아님 문제가 누락된걸까요? 16~39는 따로 강의가 없는게 맞는건가요?
-
미해결[2026년 빅분기 실기 준비] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
코드 자동완성 or 추천 기능
안녕하세요 시험 환경에서는 코드 자동완성 기능이 동작하나요?전체 자동완성까지 아니더라도,판다스의 경우'import pandas as pd'라고 선언한 경우에'pd.' 나 'pd.to_' 까지 찍으면사용 가능한 함수 목록이 표시되는지 궁금합니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 전처리 시 문의
데이터전처리에서 결측치로 인해 데이터들을 삭제하셨는데, 범주형 데이터는 : 아무 문자 "X"로 채우고수치형 데이터는 : 평균값 혹은 중앙값으로 채워도 괜찮을까요? 무턱대고 DROP하면 큰일날 거 같아서...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
random_state 값
random_state 값에 따라서 결과 값이 들쑥날쑥한데 어떻게 해결해야할까요 ? +- 5% 내에서 값이 달라지는 것 같습니다. 시험장에서는 아무숫자 대입해서 그 중 젤 나은 값으로 제출해도 무방할까요 ?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 사용여부
인코딩 사용할 때 어떠한 기준으로 원핫인코딩 vs 라벨인코딩으로 진행해야할까요 ? 그냥 전처리할때는 only 원핫인코딩 적용해도 무방할까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 전 데이터 합치기 질문드립니다!
안녕하세요. 2유형 관련 질문 드립니다! train 데이터와 test 데이터가 다를때 레이블인코딩 진행시 train의 종류가 test의 종류를 모두 포함했다면 데이터를 합치지 않아도 되고, 원핫인코딩을 할거라면 concat을 통해 데이터를 반드시 합친 후에 다시 분리해야 된다로 이해 했는데 맞을까요? train의 종류가 test를 모두 포함하지 못한다면 레이블인코딩에서도 데이터를 합친 후 다시 분리해야 할까요? 2유형 EDA을 하면서 아래와 같은 코드로 train과 test 데이터를 무조건 확인하고 진행하는것이 좋은 방법인지 궁금합니다. print(train.describe(include='O'))print(test.describe(include='O'))a = set(train['object컬럼'].unique())b = set(test['object컬럼'].unique())print(a - b)print(b – a) 모르는게 많아 질문이 길어졌습니다. 답변 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션5. 회귀 강의 관련 질문드립니다
회귀 분석에서는 스케일링이 필요가 없나요?혹은 데이터에 따라 다르다던지 별도의 기준이 있는걸까요?
-
미해결[2026년 빅분기 실기 준비] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
7회 기출문제 작업형3유형 2번째문제
문제 2번정답이 강의랑 다르게나옵니다 데이터때문같습니다; 풀이는 거의 동일하게 풀어쓴ㄴ데 답이다릅니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간연장 문의드립니다
안녕하세요~~강사님 어렵게 필기시험 합격하고강의를 듣고 실기시험을 보려했으나수술, 프로젝트 출장 등으로 실기시험을 접수만하고 시험장 한번 못가보았습니다필기 2년이되어 이번이 마지막 기회라 마지막 실기 시험을 치고 싶은데 학습완료일이 5월 29일입니다6월 시험까지 연장또는 한달만 추가 신청등 방법이 있는지 확인부탁드립니다 메일주소 pkhjjang99@gmail.com 항상 좋은 강의 고맙습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
안녕하세요. 현재 강의를 수강 중인 수강생입니다.다름이 아니라 제가 11월 시험을 준비 중인데, 현재 강의 수강기간이 10월에 종료되어 시험 전까지 복습 및 학습을 이어가기 어려운 상황입니다.시험 준비를 위해 강의를 계속 활용하고 싶어 혹시 가능하다면 수강기간을 11월 시험 일정까지 조금만 연장해주실 수 있을지 정중히 부탁드립니다.번거로우시겠지만 검토 부탁드리며, 긍정적으로 고려해주시면 감사하겠습니다. 계정: ydk9476@gmail.com
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
label 인코딩 에러 발생 원인
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요label 인코딩에서 train[cols] 확인하는 과정에서 자꾸 에러가 발생하는데 원인이 뭔지 알 수 있을까요? (12분 18초 입니다)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
LabelEncoding 시 train data 학습(fit_transform, transform)
작업형2 모의문제 풀이에서for col in cols: le = LabelEncoder() train[col]=le.fit_transform(train[col]) test[col]=le.transform(test[col]) 다음과 같이 코딩을 진행하셨는데,이는 그 후 train을 split해서 학습 시 이미 fit_transfrom이 되어 데이터 누출이 되는 방법 아닌가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱 회귀분석은 옛날거 밖에 없나요?
로지스틱 회귀분석은 구버전 밖에 없나요?신버전 찾고 있는데 못찾아서 보냅니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스 표 표시
판다스에서 시리즈 만들때 저는 화면처럼 표 형식이 아니라 이런식으로 표시되는데, 해결방법이 있을까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
1유형 강의 다 나간 후 어떻게 할까요?
일단 1유형 강의는 다들었고 모의고사 15번까지 풀어봤는데나머지 강의에 없는 16~39까지 다 풀고 2~3유형 갈지아니면 일단 강의 다 듣고 나머지 모의고사를 스스로 풀어보는 쪽이좋은지 살짝 고민되어서 쪽지 드려요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
점수차가 많이 나는데 따로 하신게 있으신가요?
안녕하세요 선생님선생님 인강 보면서 기출을 풀어보면서 시험에 대비하고 있습니다. 근데 기출 5회에서 2유형 선생님의 baseline과 제 baseline 수치가 너무 달라서 이렇게 Q&A를 보냅니다.선생님 baseline(랜포)은 1296이 나오는데 제가 한 baseline(랜포)은 1400대가 나옵니다 혹시 제가 뭘 잘 못한게 있는지 궁금합니다아래는 제가한 코드입니다! #eda print('\n====데이터 크기=====') print(train.shape,test.shape) print('\n====데이터 정보=====') print(train.info()) print('\n====train 결측치=====') print(train.isnull().sum()) print('\n====test 결측치=====') print(test.isnull().sum()) print('\n====카테고리=====') cols=train.select_dtypes(include='O').columns for col in cols: set_train=set(train[col]) set_test=set(test[col]) same=set_train==set_test if same: print(col,'O') else: print(col,'X') print('\n====타겟 기초 =====') print(train['price'].describe()) # 전처리 target=train.pop('price') train=pd.get_dummies(train) test=pd.get_dummies(test) # print(train.shape,test.shape) #검증 from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val=train_test_split(train,target,test_size=0.2,random_state=42) print(X_tr.shape,X_val.shape,y_tr.shape,y_val.shape) # rf from sklearn.ensemble import RandomForestRegressor rf=RandomForestRegressor(random_state=42) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) #학습 from sklearn.metrics import root_mean_squared_error print('===rf===') print(root_mean_squared_error(y_val,pred)) #lg import lightgbm as lgb lg=lgb.LGBMRegressor(random_state=42,verbose=-1) lg.fit(X_tr,y_tr) pred=lg.predict(X_val) print('==lg==') print(root_mean_squared_error(y_val,pred)) #lr from sklearn.linear_model import LinearRegression lr=LinearRegression() lr.fit(X_tr,y_tr) pred=lr.predict(X_val) print('==lr==') print(root_mean_squared_error(y_val,pred)) #결과 pred=lg.predict(test) submit=pd.DataFrame({'pred':pred}) submit.to_csv('result.csv', index=False)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제 4번에 3)문제 질문
안녕하세요 강사님 정답이views_min=df.iloc[:10]['views'].mindf.iloc[:10, -1]=views_min인데, df=df.iloc[0:10]df['views']=df['views'].min()이렇게 쓰면 안될까요??