묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 코랩파일 다운로드 받는 위치(경로) 문의
강의에서 알려주시는 코랩파일은 어디에서 다운로드 받을 수 있나요?엑셀 파일이나 마인드맵 자료는 다운 받았습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
얼떨결에 코드 짜서 답은 나왔는데요 0.5보다 큰걸 찾는 부분 코드가 저렇게 해도 왜 답이 제대로 나오는걸까요
from sklearn.preprocessing import MinMaxScaler Scaler = MinMaxScaler() df_Scaler = Scaler.fit_transform(df[['qsec']]) re=df_Scaler>0.5 re.sum()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
사후검정 2가지를 다 숙지해야할까요?
사후검정방법이 꽤 여러가지있고 그 중에 두가지를 반복해서 알려주시는데, 둘중에 하나만 숙지해도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
일원 또는 이원분산분석 모두 독립변수가 범주형이면 다 c를 붙이는지요?
일원 또는 이원분산분석 모두 독립변수가 범주형이면 다 c를 붙이는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4회 작업형 2 f1_score 평가할때 rf_f1 = f1_score(y_val, rf_pred, average= 'macro') 써도 되나요?
강사님 안녕하세요! 두가지 질문이 두 가지 있습니다.1)from sklearn.model_selection import cross_val_score scores = cross_val_score(train, y scoring = 'f1_macro', cv=5) 이거 대신에train_test_split(train.drop('Segmentation',axis =1),train['Segmentation'], test_size = 0.2, random_state =0 ) 이렇게 데이터를 나눈 뒤, 평가를 해도 되는지 궁금합니다. 2)그리고 cross_val_score를 쓰지 않고, 아래처럼 기존에 쓰던 직접 f1-score를 구해 모델 평가하는 방식도 괜찮은가요?rf_f1 = f1_score(y_val, rf_pred, average='macro') 감사합니다cols = list(train.select_dtypes(include = 'O')) cols #['Gender','Ever_Married','Graduated','Profession','Spending_Score','Var_1'] # train[cols].nunique() #(2,2,2,9,3,7) # for col in cols: # print(train[col].value_counts()) train = train.drop('ID',axis =1) test_id = test.pop('ID') # from sklearn.preprocessing import LabelEncoder # for col in cols: # le = LabelEncoder() # train[col] = le.fit_transform(train[col]) # test[col] = le.transform(test[col]) # train.head() train = pd.get_dummies(train).astype(int) #(6665,30) test = pd.get_dummies(test).astype(int) #(2154,29) # print(train.shape,test.shape) # print(train.shape,test.shape) #(6665, 29) (2154, 28) train.head() from sklearn.model_selection import train_test_split X_train, X_val, y_train, y_val = train_test_split(train.drop('Segmentation',axis =1),train['Segmentation'], test_size = 0.2, random_state =0 ) print(X_train.shape,X_val.shape,y_train.shape, y_val.shape) #(5332, 28) (1333, 28) (5332,) (1333,) from sklearn.metrics import f1_score from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state = 0, max_depth = 9, n_estimators = 700) rf.fit(X_train,y_train) rf_pred = rf.predict(X_val) rf_f1 = f1_score(y_val, rf_pred, average= 'macro') print(rf_f1) # 0.5350437339763565 /9 700 0.543685768934749 # # from lightgbm import LGBMClassifier # # lgbm = LGBMClassifier() # # lgbm.fit(X_train, y_train) # # lgbm_pred = lgbm.predict(X_val) # # lgbm_f1 = f1_score(y_val, lgbm_pred, average= 'macro') # # print(lgbm_f1) #0.5277491575057244 pred = rf.predict(test) sumbit = pd.DataFrame({'ID':test_id, 'Segmentation': pred}) sumbit.to_csv('submission.csv', index = False) pd.read_csv('submission.csv') #0.31924
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 6회 작업형 2 질문입니다.
07:26에서"f1 스코어로 예측할때는 확률 값이 아니라 클래스로 나누기 때문에 predict로 예측해야한다"라고 말씀해주셨는데 이 부분에서 질문이 생겼습니다!1) 확률 값으로 예측하는건 평가지표 중 roc_auc_score 뿐인지2) 만약 평가 지표로 roc_auc로 한다고 문제에 출제되었으면 제출 예시로 확률 값이 아닌 클래스 값으로 나온 것 처럼 보여도 predict_proba ()로 예측해도 되는지 궁금합니다!-> 제가 알고있기론 roc_auc_score가 평가 지표여도 predict()를 사용해서 해도 되지만, 평가 성능이 차이가 나는 걸로 알고 있는데 제대로 알고 있는건지 여쭙습니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
리턴 이해 예시 질문
예전부터 리턴에 대해 모호하게 이해하고 있어서 질문드립니다. # 함수 정의 (리턴 값) def plus(x, y): result = x+y return result# 함수 호출 a = plus(2,3) print(a)이러면 값이 5가 나오는데# 함수 정의 (리턴 값) def plus(x, y): result = x+y# 함수 호출 a = plus(2,3) print(a)이러면 값이 NONE이 나오는 이유가 리턴이 없어서 왜 a = 2+3으로 받아들이지 못하는 건지 궁금합니다.# 함수 정의 (리턴 값) def plus(x, y): result = x+y result# 함수 호출 a = plus(2,3) print(a)이 값 또한 NONE으로 출력되는데두번째 함수 호출 코드에서 plus(2,3) 이니까 plus(2,3) = result 이고 result 는 5이니깐 a = 5이므로 print (a) 는 5가 되어야 하는게 아닌가요? return이 없으면 함수에 무엇을 대입하든 변수에 값이 저장되지 않는 느낌이네요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
일원분산분석은 f_oneway 방법으로만 알고있음 안되나요?
일원분산분석은 f_oneway 방법으로만 알고있음 안되나요? 반드시 stats에서 제공하는 함수로 테이블로 만드는 방법까지 숙지하는것이 필수일까요 ㅜ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
교수님 강의에 쓰시는 구글 드라이브 사본 더 볼 수 있을까요?
인강 틀고 따라하고 있는데, 멈추고 쓰는게 모니터 하나로는 예시 일일이 쓰고 인강 듣기가 조금 버벅거려서요 ㅠㅠ...일단 교수님이 강의에 활용하시는 구글 드라이브(코랩) 만 있으면 한번 돌린다음에 제가 따로 돌리고 비교하기엔 수월할 것 같아서 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 풀이 관련
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요교재에 있는 작업형 1 예시문제는 어디서 풀어볼 수 있을까요? 캐글에도 없고 수업노트에도 없는거 같아요
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
훈련과 Predict를 분리할수 없나요?
AI강의중 Best였던것 같습니다. 강의 다 듣고 나서 한가지 궁금한게 생기는데강의 코딩에는 모두 한 소스코드에서훈련(fit)하고 바로 predict하는 pattern으로 소스가 제공되었습니다. 혹시 훈련(fit)해서 어딘가에 저장해 두었다가 해당 저장내용을 기반으로 특정 필요한 시점에 predict 해서 결과를 사용하고 싶은데 이런 방법이 있을까요? 이 방법이 설명이 간단하지 안다면 책이나 인터넷 사이트라도 추천해 주시면 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
object type
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요자료형의 유형에 object는 없던것같아요type이 object라는 개념이 이헤가 잘 안갑니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스1 수업노트 코랩 실행중 오류
판다스 1 강의 수업노트에 있는 코랩 링크로 바로 접속 후 작성되어있는 코드를 지우고 새로 똑같이 작성 후 실행하니 판다스 라이브러리를 불러오는 것에서부터 오류가 생기는 것 같습니다 ㅜ.ㅜ 어떻게 해야 하나요 ? NameError: name 'pd' is not defined
-
미해결파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
quota increase 요청 승인이 안됩니다.
강의에서 일러주신 대로 basic으로 계정 권한 업그레이드 후 quota increase 요청을 하였고, 접수되었다고 이메일이 왔는데, 한참이 지나도 접수 승인 메일이 오지 않습니다. 다시 quotas에서 확인해보니 16개로 늘어나 있지도 않습니다. 추후 어떤 action을 더 해야 할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 4회 작업형 2, train_test_split
기출 4회 작업형 2 풀이 강의에서, train_test_split을 사용하지 않으시던데,이건 target값이 이진분류가 아니라서 그런건지요? train_test_split을 사용하여 모델을 분리하고,f1_score로 검증해보려고 하니 오류가 나옵니다. target값이 이진분류가 아니면 제출전 사전 검증이 불가능한건지 알고 싶습니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 질문입니다.
디스코드에 있는 미션을 매일매일 하고있는데요.. 미션은 웬만큼 할만한데 저번 9회차 모의고사를 풀어보니까 한문제 빼고는 손도 못대는 수준이어서요.. 이런 경우엔 작업형3을 비중을 둬야하는건지.. 아니면 계속 작업형을 풀어봐야하는건지.. 질문드립니다ㅠㅠ 그래도 좀 숙달됐다고 생각했는데 막상 9회차 작업형1을 풀어볼려니까 결이 다른수준이라 ㅠㅠ 너무 걱정되네요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
model.predict() 이 괄호안에는 반드시 데이터프레임형태만으로 들어가야하나요?
강의에서 몸무게가 50일때의 예측키를 구하는 문제에서몸무게가 50인걸 데이터프레임으로 꼭 만들어야지만 가능한걸까요? if 조건문이나 그런걸로는 파이썬에는 잘 사용안하는지요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
궁금한게 있는데
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제를 더 연습하려고 하는데 캐글 놀이터 ? 사용법 정리된 영상은 없나요?? 작업형 1 2 3 구분된 문제, 어떤거 부터 풀어야할지 잘 모르겠습니다. 사용법도 모르겠그ㅜ요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
상관관계 높다라는 말은 + 에만 해당되는걸까요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요7회차 작업형3 기출 유형 문제중 문제 2-1 ERP 와 가장 상관관계가 높은값을 구하시오 관련 사항입니다. 상관관계가 높다라는 말은 + 에만 해당되는것일까요 혹시 - 값의 절대값이 클경우 높다라는 말을 할수 있는건가요 ?
-
미해결AI 이해를 위한 파이썬 기초
리스트 기초 부분 문의
4페이지에 리스트 기초 부분에 게임 대신 스포츠가 들어간다 하셨는데 왜 "스포츠","독서"가 아닌 스포츠 게임으로 되는지 궁금합니다. 오류인가요?