묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
사후검정 2가지를 다 숙지해야할까요?
사후검정방법이 꽤 여러가지있고 그 중에 두가지를 반복해서 알려주시는데, 둘중에 하나만 숙지해도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
일원 또는 이원분산분석 모두 독립변수가 범주형이면 다 c를 붙이는지요?
일원 또는 이원분산분석 모두 독립변수가 범주형이면 다 c를 붙이는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 작업형 2 f1_score 평가할때 rf_f1 = f1_score(y_val, rf_pred, average= 'macro') 써도 되나요?
강사님 안녕하세요! 두가지 질문이 두 가지 있습니다.1)from sklearn.model_selection import cross_val_score scores = cross_val_score(train, y scoring = 'f1_macro', cv=5) 이거 대신에train_test_split(train.drop('Segmentation',axis =1),train['Segmentation'], test_size = 0.2, random_state =0 ) 이렇게 데이터를 나눈 뒤, 평가를 해도 되는지 궁금합니다. 2)그리고 cross_val_score를 쓰지 않고, 아래처럼 기존에 쓰던 직접 f1-score를 구해 모델 평가하는 방식도 괜찮은가요?rf_f1 = f1_score(y_val, rf_pred, average='macro') 감사합니다cols = list(train.select_dtypes(include = 'O')) cols #['Gender','Ever_Married','Graduated','Profession','Spending_Score','Var_1'] # train[cols].nunique() #(2,2,2,9,3,7) # for col in cols: # print(train[col].value_counts()) train = train.drop('ID',axis =1) test_id = test.pop('ID') # from sklearn.preprocessing import LabelEncoder # for col in cols: # le = LabelEncoder() # train[col] = le.fit_transform(train[col]) # test[col] = le.transform(test[col]) # train.head() train = pd.get_dummies(train).astype(int) #(6665,30) test = pd.get_dummies(test).astype(int) #(2154,29) # print(train.shape,test.shape) # print(train.shape,test.shape) #(6665, 29) (2154, 28) train.head() from sklearn.model_selection import train_test_split X_train, X_val, y_train, y_val = train_test_split(train.drop('Segmentation',axis =1),train['Segmentation'], test_size = 0.2, random_state =0 ) print(X_train.shape,X_val.shape,y_train.shape, y_val.shape) #(5332, 28) (1333, 28) (5332,) (1333,) from sklearn.metrics import f1_score from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state = 0, max_depth = 9, n_estimators = 700) rf.fit(X_train,y_train) rf_pred = rf.predict(X_val) rf_f1 = f1_score(y_val, rf_pred, average= 'macro') print(rf_f1) # 0.5350437339763565 /9 700 0.543685768934749 # # from lightgbm import LGBMClassifier # # lgbm = LGBMClassifier() # # lgbm.fit(X_train, y_train) # # lgbm_pred = lgbm.predict(X_val) # # lgbm_f1 = f1_score(y_val, lgbm_pred, average= 'macro') # # print(lgbm_f1) #0.5277491575057244 pred = rf.predict(test) sumbit = pd.DataFrame({'ID':test_id, 'Segmentation': pred}) sumbit.to_csv('submission.csv', index = False) pd.read_csv('submission.csv') #0.31924
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 6회 작업형 2 질문입니다.
07:26에서"f1 스코어로 예측할때는 확률 값이 아니라 클래스로 나누기 때문에 predict로 예측해야한다"라고 말씀해주셨는데 이 부분에서 질문이 생겼습니다!1) 확률 값으로 예측하는건 평가지표 중 roc_auc_score 뿐인지2) 만약 평가 지표로 roc_auc로 한다고 문제에 출제되었으면 제출 예시로 확률 값이 아닌 클래스 값으로 나온 것 처럼 보여도 predict_proba ()로 예측해도 되는지 궁금합니다!-> 제가 알고있기론 roc_auc_score가 평가 지표여도 predict()를 사용해서 해도 되지만, 평가 성능이 차이가 나는 걸로 알고 있는데 제대로 알고 있는건지 여쭙습니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
리턴 이해 예시 질문
예전부터 리턴에 대해 모호하게 이해하고 있어서 질문드립니다. # 함수 정의 (리턴 값) def plus(x, y): result = x+y return result# 함수 호출 a = plus(2,3) print(a)이러면 값이 5가 나오는데# 함수 정의 (리턴 값) def plus(x, y): result = x+y# 함수 호출 a = plus(2,3) print(a)이러면 값이 NONE이 나오는 이유가 리턴이 없어서 왜 a = 2+3으로 받아들이지 못하는 건지 궁금합니다.# 함수 정의 (리턴 값) def plus(x, y): result = x+y result# 함수 호출 a = plus(2,3) print(a)이 값 또한 NONE으로 출력되는데두번째 함수 호출 코드에서 plus(2,3) 이니까 plus(2,3) = result 이고 result 는 5이니깐 a = 5이므로 print (a) 는 5가 되어야 하는게 아닌가요? return이 없으면 함수에 무엇을 대입하든 변수에 값이 저장되지 않는 느낌이네요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
일원분산분석은 f_oneway 방법으로만 알고있음 안되나요?
일원분산분석은 f_oneway 방법으로만 알고있음 안되나요? 반드시 stats에서 제공하는 함수로 테이블로 만드는 방법까지 숙지하는것이 필수일까요 ㅜ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
교수님 강의에 쓰시는 구글 드라이브 사본 더 볼 수 있을까요?
인강 틀고 따라하고 있는데, 멈추고 쓰는게 모니터 하나로는 예시 일일이 쓰고 인강 듣기가 조금 버벅거려서요 ㅠㅠ...일단 교수님이 강의에 활용하시는 구글 드라이브(코랩) 만 있으면 한번 돌린다음에 제가 따로 돌리고 비교하기엔 수월할 것 같아서 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 풀이 관련
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요교재에 있는 작업형 1 예시문제는 어디서 풀어볼 수 있을까요? 캐글에도 없고 수업노트에도 없는거 같아요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
object type
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요자료형의 유형에 object는 없던것같아요type이 object라는 개념이 이헤가 잘 안갑니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스1 수업노트 코랩 실행중 오류
판다스 1 강의 수업노트에 있는 코랩 링크로 바로 접속 후 작성되어있는 코드를 지우고 새로 똑같이 작성 후 실행하니 판다스 라이브러리를 불러오는 것에서부터 오류가 생기는 것 같습니다 ㅜ.ㅜ 어떻게 해야 하나요 ? NameError: name 'pd' is not defined
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 4회 작업형 2, train_test_split
기출 4회 작업형 2 풀이 강의에서, train_test_split을 사용하지 않으시던데,이건 target값이 이진분류가 아니라서 그런건지요? train_test_split을 사용하여 모델을 분리하고,f1_score로 검증해보려고 하니 오류가 나옵니다. target값이 이진분류가 아니면 제출전 사전 검증이 불가능한건지 알고 싶습니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 질문입니다.
디스코드에 있는 미션을 매일매일 하고있는데요.. 미션은 웬만큼 할만한데 저번 9회차 모의고사를 풀어보니까 한문제 빼고는 손도 못대는 수준이어서요.. 이런 경우엔 작업형3을 비중을 둬야하는건지.. 아니면 계속 작업형을 풀어봐야하는건지.. 질문드립니다ㅠㅠ 그래도 좀 숙달됐다고 생각했는데 막상 9회차 작업형1을 풀어볼려니까 결이 다른수준이라 ㅠㅠ 너무 걱정되네요
-
미해결[핵집] 2025 빅데이터 분석기사(필기)_과목 3~4
통합 강의 교재 부탁드립니다.
안녕하세요 통합 강의 교안 부탁드립니다. anaglory@naver.com 로 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
model.predict() 이 괄호안에는 반드시 데이터프레임형태만으로 들어가야하나요?
강의에서 몸무게가 50일때의 예측키를 구하는 문제에서몸무게가 50인걸 데이터프레임으로 꼭 만들어야지만 가능한걸까요? if 조건문이나 그런걸로는 파이썬에는 잘 사용안하는지요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
궁금한게 있는데
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제를 더 연습하려고 하는데 캐글 놀이터 ? 사용법 정리된 영상은 없나요?? 작업형 1 2 3 구분된 문제, 어떤거 부터 풀어야할지 잘 모르겠습니다. 사용법도 모르겠그ㅜ요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
상관관계 높다라는 말은 + 에만 해당되는걸까요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요7회차 작업형3 기출 유형 문제중 문제 2-1 ERP 와 가장 상관관계가 높은값을 구하시오 관련 사항입니다. 상관관계가 높다라는 말은 + 에만 해당되는것일까요 혹시 - 값의 절대값이 클경우 높다라는 말을 할수 있는건가요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 머신러닝 new old 질문
안녕하세요, 작업형2 머신러닝 신유형, 구유형이 있는데 신유형만 들어도 되는지, 둘 다 들어야 하는지 궁금합니다
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
6회 작업형1 3번과 작업형2 1번 동영상 실행오류
6회 작업형1 3번과 작업형2 1번 동영상이 시작하다가 무한루프가 됩니다.동영상 상태 확인 부탁드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의6~7분쯤 윌콕슨 검정~ 모두다 똑같은 데이터로 작성해서 결과를 보는데 pvalue값이 다르게 나오네요 저는 ㅠ왜그런걸까요
같은 데이터프레임으로 복사해서 코드돌려보는데(지금 다시봐도 데이터프레임 값 그대로 복붙해져있고요)왜 저는 pvalue값이 다르게 나올까요 ㅠ차이가 심지어 큰거같습니다..(샤피로검정때에도 보면 결과값이 약간 차이는 있습니다)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
재수생입니다 교재가 강의보다 조금 더 어려울까요?
강의만 구매했는데 책도 구매하는게 좋을까요?책이 더 어렵나요?