묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
1유형 강의 다 나간 후 어떻게 할까요?
일단 1유형 강의는 다들었고 모의고사 15번까지 풀어봤는데나머지 강의에 없는 16~39까지 다 풀고 2~3유형 갈지아니면 일단 강의 다 듣고 나머지 모의고사를 스스로 풀어보는 쪽이좋은지 살짝 고민되어서 쪽지 드려요.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
점수차가 많이 나는데 따로 하신게 있으신가요?
안녕하세요 선생님선생님 인강 보면서 기출을 풀어보면서 시험에 대비하고 있습니다. 근데 기출 5회에서 2유형 선생님의 baseline과 제 baseline 수치가 너무 달라서 이렇게 Q&A를 보냅니다.선생님 baseline(랜포)은 1296이 나오는데 제가 한 baseline(랜포)은 1400대가 나옵니다 혹시 제가 뭘 잘 못한게 있는지 궁금합니다아래는 제가한 코드입니다! #eda print('\n====데이터 크기=====') print(train.shape,test.shape) print('\n====데이터 정보=====') print(train.info()) print('\n====train 결측치=====') print(train.isnull().sum()) print('\n====test 결측치=====') print(test.isnull().sum()) print('\n====카테고리=====') cols=train.select_dtypes(include='O').columns for col in cols: set_train=set(train[col]) set_test=set(test[col]) same=set_train==set_test if same: print(col,'O') else: print(col,'X') print('\n====타겟 기초 =====') print(train['price'].describe()) # 전처리 target=train.pop('price') train=pd.get_dummies(train) test=pd.get_dummies(test) # print(train.shape,test.shape) #검증 from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val=train_test_split(train,target,test_size=0.2,random_state=42) print(X_tr.shape,X_val.shape,y_tr.shape,y_val.shape) # rf from sklearn.ensemble import RandomForestRegressor rf=RandomForestRegressor(random_state=42) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) #학습 from sklearn.metrics import root_mean_squared_error print('===rf===') print(root_mean_squared_error(y_val,pred)) #lg import lightgbm as lgb lg=lgb.LGBMRegressor(random_state=42,verbose=-1) lg.fit(X_tr,y_tr) pred=lg.predict(X_val) print('==lg==') print(root_mean_squared_error(y_val,pred)) #lr from sklearn.linear_model import LinearRegression lr=LinearRegression() lr.fit(X_tr,y_tr) pred=lr.predict(X_val) print('==lr==') print(root_mean_squared_error(y_val,pred)) #결과 pred=lg.predict(test) submit=pd.DataFrame({'pred':pred}) submit.to_csv('result.csv', index=False)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제 4번에 3)문제 질문
안녕하세요 강사님 정답이views_min=df.iloc[:10]['views'].mindf.iloc[:10, -1]=views_min인데, df=df.iloc[0:10]df['views']=df['views'].min()이렇게 쓰면 안될까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이상치 전처리 작업
안녕하세요 강사님다름아니라 2과목 중 데이터 전처리에서 이상치 관련 질문있습니다.제가 강의를 듣었을 때는 이상치를 데이터의 현실적 한계성으로 판단하신거로 이해하였습니다.ex( age 컬럼은 음수가 될 수 없다.)제가 예전에 학교에서는 이상치를 quantile을 통해 IQR값을 추출하고 그 추출한 값을 바탕으로 이상치를 판단했었던 기억이 있습니다. 그렇기에 빅데이터분석기사에서 이상치 값을 판단할 때, IQR로 이상치를 판단 또한 하는게 맞을까요? 아니면 이 과정까지는 필요가 없을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가결과값 문의
초반에 target(output)을 pop을 이용해 분류하고 검증데이터 분할, 모델 생성/학습을 진행했습니다. roc-auc, f1score, accuracy 평가결과가 1.0 으로 나오는 이유는 뭘까요....? # 타켓설정 target = train.pop('output') # 검증데이터분할 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size = 0.15, random_state = 0) from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state = 0) rf.fit(X_tr, y_tr) pred = rf.predict(X_val) pred_proba = rf.predict_proba(X_val) from sklearn.metrics import roc_auc_score, f1_score, accuracy_score print(roc_auc_score(y_val, pred_proba[:, 1])) print(f1_score(y_val, pred)) print(accuracy_score(y_val, pred)) ----------------------------------- 1.0 1.0 1.0
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시계열 데이터 날짜와 시간 format
강사님, 안녕하세요.해당 강의에서는 시간 format 파라미터 사용시H만 대문자로 사용하면 된다고 하셨는데,e-book에서는 H:M:S 다 대문자로 되어야한다고 적혀있어서요. 어떤게 맞을까요???
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 F1 스코어 질문드립니다.
안녕하세요!F1 스코어 설명하시면서average = micro, macro, weighted중에 문제에서 요구하는데로 쓰면 된다고 하셨는데..만약 문제에서 제시된 평가지표가 F1 스코어가 아니지만 F1 스코어를 사용하려고 할 경우(문제에서 요구된게 없는 경우)에는 micro, macro, weighted 중 어떤걸 사용하면 될까요?감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 기출7회분에서
안녕하세요혹시 선형회귀모델에서 rmse 값이 가장 낮게 나왔어서 모델을 선택하고 실제 test 데이터를 예측하는데, 이 과정에서 80프로의 train으로 학습한 모델이잖아요..?나중에 train 자체 100프로를 재학습시킨 후 test 예측하는게 더 올바른 것인지.. 이 과정 없이 그동안 진행해온 부분으로 바로 test 예측하는게 좋은지 궁금해요!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제1 (30강)
수업에서는 수치형 데이터에 대한 스케일링을 미실시 하였고, 학습 모델도 랜덤포레스트로만 진행하였습니다. 수치형 데이터에 대해 StandardScaler, RobustScaler 등의 스케일링을 실시하고, lightgbm 모델도 학습을 했을 때 랜덤포레스트 모델보다 성능이 좋게 나왔습니다. 혹시 이 문제에서 스케일링을 하면 안되는 이유나 lightgbm으로 했을 때 발생할 수 있는 문제가 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 기간 연장 문의 드립니다.
안녕하세요.작년 개인 일정으로 인해 응시하지 못했던 실기 시험을 다가오는 6월 20일에 치르고자 준비하고 있습니다. 현재 제가 수강 중인 강의의 종료일이 2026년 5월 20일로 예정되어 있어 문의를 드립니다.혹시 수강 기간을 실기 시험일 인 2026년 6월 20일 까지 연장해 주실 수 있는지 조심스럽게 여쭤보고 싶습니다.만약 연장을 해주신다면, 남은 기간 동안 더욱 열심히 수강하여 이번 시험에 꼭 합격하고 싶습니다.긍정적으로 검토해 주시면 감사하겠습니다.감사합니다. 계정 이메일: whddlsghd@naver.com
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 계획과 관련해 문의 드립니다.
강사님 안녕하세요. 수강 계획을 짜기 위해, 관련하여 문의드리려고 합니다. 현재 제가 여러가지 일을 병행하고 있어, 실기 시험일 (6월 20일) 까지 강의 수강 및 시험 대비 계획을 짜려고 합니다.강의 중 '최근 시험이 이전보다 좀 더 어려워져서 강의 계획에 포함된 문제들뿐만 아니라, 케글에 업로드 해 놓은 문제도 풀어보는 것이 필요하다'는 이야기를 들은 바 있어서, 해당 문제들을 푸는것도 계획에 포함시키기 위해 '해당 문제들은 어느정도 풀어봐야 실기 시험에 안정적으로 합격할 수 있다' 라 할 수 있을만한 대략적인 양이 있는지 궁금해 질문드립니다. 또한 현재 총 강의 중 10% 정도를 수강했는데, 비전공자로서 이전에 대학에서 방학동안 들었던 데이터 분석 강의에서 배운 내용을 환기하는데 도움 많이 되었습니다. 이에 좋은 강의 제공해 주셔서 감사합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?
안녕하세요22강 작업형1 연습문제 13~15번까지 듣고,그 이후 문제인 16번~39번까지의 연습문제 풀이를 보려고 찾아봤는데 강의를 못 찾아서요...나머지 16~39번 풀이는 몇강을 보면 되는지 궁금합니다.몇강을 보면 되는지 답변해 주시면 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 -연습문제 4-6
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 선생님작업형1 4-6 NEW 강의에서Section 5번답이 0.61인데 저는 계속해서 0.68이 나오네요 ㅠ오타일 확률은 없는거겠죠FJ포함된 조건으로 cond 작성한다음df[cond].shape하면 28개행 나옵니다
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 유형 부분
이전에 작업형 1,2 를 학습하고 3을 학습중인데, 오늘 확인해보니 작업형 1 새로운 강의들이 올라왔더라구요..?? 어떠한 차이가 있어서 구버전은 삭제가 되는지 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 (삭제예정, 구 버전)
안녕하세요 강사님 강의 열심히 잘 듣고 있습니다!다름이 아니라 시간이 부족해서 효율적으로 학습을 해야하는 상황입니다!모의문제 1~15번까지 풀었고 그 밑에 삭제예정인 구 버전들도 필수로 풀어봐야하는지 궁금합니다!별로 좋은 질문인 것 같진 않네요ㅠㅠ 하지만 열심히 해서 합격하겠습니다😋
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간 연장 문의드립니다.
선생님 안녕하세요.빅분기 실기 강의를 수강하고 있는 수강생입니다. 제가 해당 강의를 작년 5월 중순에 결제하였으나,개인적인 사정으로 인해 그동안 실기시험에 응시하지 못하여다가오는 6월 20일 실기시험을 목표로 다시 준비를 시작하게 되었습니다. 현재 수강기간이 약 2주 정도밖에 남지 않은 상황이라,남은 기간만으로는 강의 내용을 충분히 복습하고 시험대비를 마치기 어려운 상태입니다. 혹시 수강기간 연장 또는 1개월 부분결제가 가능할지 정중히 문의 드립니다.제 메일 주소는 ghn04055@naver.com 입니다. 감사합니다.좋은 하루 보내시길 바랍니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 레이블 인코딩 VS 원핫 인코딩
안녕하세요 12회 시험을 준비하고 있는 취준생입니다다름이 아니라 궁금한게 있어서 이렇게 Q&A를 남깁니다!레이블 인코딩보다는 원핫 인코딩을 사용하는 것이 훨씬 점수가 작게 나오는데 왜 굳이 이번 레이블 인코딩을 사용했는지 궁금합니다(원핫 인코딩 쓰면 rf나 lg 모두 946점대가 나와서 레이블보다는 거의 5점대 차이가 납니다!)혹시 범주형 카테고리가 10개 이상이라서 레이블을 쓰신건가요?다음 시험때때는 그냥 레이블 보다는 원핫만 써도 상과없는지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간 연장 문의드립니다.
안녕하세요. 현재 강의 수강 기간이 5월 20일까지로 확인되는데 12회 실기 시험이 6월 20일로 예정되어 있어 준비 기간이 다소 부족한 상황입니다. 혹시 수강 기간을 약 한 달 정도 연장할 수 있는지 또는 추가 결제를 통해 일부 기간만 연장하는 것이 가능한지 문의드립니다. 이메일은 tjdqls4516@naver.com 입니다. 검토 후 회신 주시면 감사하겠습니다!! 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인덱스 슬라이싱
슬라이싱 연습에서 마지막 앞단어 출력할때listbox[-2]는 안되나요??
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문 드립니다.
df = df.sort_values(['가격', '메뉴'],ascending=[False, True])df 이부분이 책에서는 df.sort_values(['가격', '메뉴'],ascending=[False, True], inplace=True)df 라고 되어있는데 같은 뜻일까요?