묻고 답해요
160만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요 캐글 실습중에 문의드립니다.
안녕하세요 강사님캐글에서 script editor type 으로 코드를 실행하면 자꾸 NameError 가 발생합니다.(강사님이 제공해주는 코드를 실행해도 동일합니다.)학습은 notebook 으로 전환해서 수행중인데 뭐가 문제인지 확인 부탁 드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
효율적인 강의 수강 방법이 뭘까요?
안녕하세요 선생님,강의 잘 듣고 있습니다.직접 코드를 작성하며 공부를 하고 있지만, 1주일 동안 모의고사를 제외한 이론파트를 모두 보면서 우선은 코드를 아무것도 보지 않고 완전히 친다기 보단, 전체적인 흐름 위주로 이해하려 했습니다. 내일부터는 모의고사 강의를 보면서 강의 노트에 있는 내용을 바로 칠 수 있도록 계속 반복 학습을 하려고 합니다.이제 실기시험까지 약 한달정도 남았는데요. 이론을 다 보고 나서 이후 모의고사 인강을 계속 보면서 코드를 익숙해질때까지 익히는게 나을지, 아니면 다시 또 이론 처음부터 보는게 나을지 시험 준비와 관련 추가 팁을 여쭙고자 글을 남깁니다. 바쁘시겠지만 보시면 답글 남겨주시면 감사하겠습니다.좋은 강의 만들어 주셔서 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요 작업형 3 체험링크를 들어갔는데 문제 내용이 달라서 문의드립니다.
아래 링크로 들어갔는데 문제내용이 아래와 같이 나와서요... 혹시 아래 링크 해설이나 답을 알 수 있을까요 ? 무례한 부탁일 수 있지만 영상제작도 가능할까용 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 질문입니다..
이와 같이 mode 변수의 클래스 수가 다른데...ct = make_column_transformer((OneHotEncoder(sparse=False), col_cat), (StandardScaler(), col_num))ct.fit(X)X = ct.transform(X)X_te = ct.transform(X_te)print(X.shape)print(X_te.shape)이것을 적용하니...(7468, 37) (3200, 37) 이렇게 컬럼이 동일해졌습니다... make_column_transformer가 컬럼 수를 맞춰주는 기능도 있나요? 이해가 잘 안갑니다..ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse(np.exp(y_val),no.exp(pred)) 작업시 나오는 에러메세지 해결 방법
rmse를 진행하는 부분에서rmse(y_val,pred) 라고 진행하면 문제가 없으나후에 y값에 들어갈 charges 컬럼 데이터에 로그를 씌워 단위 변환한 평가값과 비교하기 위해기존 데이터 평가에 rmse(np.exp(y_val),np.exp(pred))를 씌워보면Found input variables with inconsistent numbers of samples: [161, 268] 혹은Input contains infinity or a value too large for dtype('float64').와 같은 에러가 뜹니다. 혹시 제가 어떤 작업을 놓친 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최대 최소 스케일링과 , test.pop
스케일링과 test.pop 코드는 반드시 사용해야하나요?저는 스케일링과 cust_id에 대한 test.pop을 안쓰고 모델링을 했는데 저처럼 해도 괜찮나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다중분류 확률값 제출에 대해서 질문드립니다!
안녕하세요 선생님 계속 질문드려서 죄송합니다. 다름이 아니라 pred_proba를 test 데이터에 적용하고 제출할때 오류가 발생해서 질문드립니다.y_val_dumm = pd.get_dummies(y_val) pred_proba = model.predict_proba(X_val) print(roc_auc_score(y_val_dumm, pred_proba, multi_class = 'ovo')) ####마지막 제출!! pred_proba = model.predict_proba(test) pd.DataFrame({'id':test_id, 'Seg':pred_proba}) "Per-column arrays must each be 1-dimensional" 오류가 발생합니다. pred_proba의 컬럼을 지정 안해줘서 그런거 같은데 마지막 제출은 어떻게 해야 하나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5-2 작업형 문의
name, host_name은 둘다 3만이 넘는 고윳값 때문데 삭제하는 건 알겠는데 host_name은 9943개인데 삭제하는 이유를 알 수 있을까요? latitude, longitude 얘네는 host_name보다 고윳값이 많은데 삭제하지 않는 이유는 수치형 데이터여서 그런가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨 인코더할 때 le = LabelEncoder() 구문을 반복하는 이유가 있나요?
라벨 인코더할 때 le = LabelEncoder() 구문을 반복하는 이유가 있나요?for 문 밖에서 한번 만들어 놓고 계속 쓰면 안되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-3 수업에서 이상치를 제거할 때
X_train = X_train[X_train['age']>0] 위의 코드를 사용해서 이상치를 제거하게 되면 나중에 3-5에서 머신런닝을 시킬때 X_train과 y_train의 길이가 불일치되서 오류를 유발하지 않나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-5 Classification 수업에서요.
왜 처음부터 데이터를 train_test_split 로 나누고 시작하는게 아니라 마지막에 왜 데이터를 나누어서 다시 시작하는 건가요? train_test_split으로 나누지 않고도 X_train과 y_train만으로도 predict_proba는 적용할 수 있지 않나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
numpy 함수에 대해 질문드립니다 선생님...!!
제가 아직 개념이 완전히 잡혀있지 않아서 생기는 궁금증인것같습니다.. import numpy as np 를 하면 numpy 라이브러리를 불러오는걸로 알고있는데요! 그럼 도대체 언제 이 라이브러리를 불러오는건지 정해져있는게 있을까요?어떤 상황에서 불러와야된다...이런게 있는지 궁급합니다.예제 문제들을 풀고있는데 표준편차의 절대값 차이를 출력할때도 numpy를 불러와서 np.abs(a - b) 이렇게 쓰던데...언제는 쓰고 언제는 안쓰는건지 이런 개념이 궁금합니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이번에는 스터디 안하는지 궁금합니다!!
이번에는 스터디 안하는지 궁금합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경에서 적용했을 때 결과가 잘려서 보입니다 ㅠㅠ
시험환경에서 적용했을 때 결과가 잘려서 보입니다 ㅠㅠ 아래와 같이 예측구간만 나오고 신뢰구간을 확인할 수 없을 때 모두 보고싶으면 어떻게 하나요 ???
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수업노트, 링크첨부가 안보입니다
데이터 분석을 위한 파이썬 기초1에서 수업노트에 링크를 첨부해두었다고 하셨는데 수업노트는 어디에 있나요?수업노트,링크를 찾을 수 없습니다.F&Q에서는 화면 오른쪽 상단에 초록색으로 구름모양 아이콘이 있는데 이 강의에서는 찾을 수 없습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 모의문제 1 - 문제 2 질문있습니다.
강사님.. ㅎㅎ 제가 또 작성했는데 결과값이 다르게 나와서요 ㅜㅜ 한번 검토 부탁드립니다!!제 결과값은 79가 나왔어요! 정답은 56이구요!!# your code import pandas as pd import numpy as np df=pd.read_csv('members.csv') # df.head() # 주어진 데이터에서 결측치가 30%이상 되는 컬럼을 찾고 해당 컬럼에 결측치가 있는 데이터(행)를 삭제 함. # print(len(df)) # 100 # 결측치가 30% 이상 = 30개 이상 # print(df.isnull().sum()) # f1 - 31개 , f3 -28개, views-4개 확인 # 따라서 f1은 결측치 있는 행 제거, f3은 최빈값으로 값 대체 df['f1'] = df['f1'].dropna() df['f3'] = df['f3'].fillna(df['f3'].mode()[0]) cond = (df['f3'] == 'gold') ans = len(df[cond]) print(ans)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 모의문제 1-문제 1 질문있습니다.
제가 코드를 이렇게 작성했는데 강사님의 답은 3261이고 제 답은 3661입니다.코드를 보면 강사님의 코드와 동일한 결과값이 나와야하지않나..하고 생각이 드는데 어디가 틀렸는지 한번 검토 부탁드립니다.!!# your code import pandas as pd import numpy as np data = pd.read_csv('members.csv') data.head() # f1 컬럼 결측치 중앙값으로 대체 f1_median = data['f1'].median() data['f1'] = data['f1'].fillna(f1_median) # 나머지 결측치 있는 데이터 모두 제거 data = data.dropna() # print(data.isnull().sum()) # 앞에서부터 70% 데이터 중 views 컬럼의 3사분위 수에서 1사분위 수를 뺀 값을 구하시오 (단, 데이터 70% 지점은 정수형(int) 변환) view70 = int(len(data)*0.7) # print(view70) data = data.loc[:view70] Q3 = data['views'].quantile(0.75) Q1 = data['views'].quantile(0.25) ans = Q3 - Q1 print(ans)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
전처리 질문입니다.
데이터 스케일링과 인코딩을 위해 make_column_transformer를 사용하고 샆은데,혹시 이것을 사용하면 문제가 될 것이 있을까요? 그리고, 통계쪽에서, stats_models까지 준비해야 할까요?.. 아직 공개된 패키지에는 없어 보이는데..시간은 없는데 할게 많다보니...ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스 똑같이 코드를 넣었는데 이렇게 뜨면 뭐가 문제인가요?
(사진)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
피처 엔지니어링 관련 질문
안녕하세요 선생님!train, test 데이터를 합치고 인코딩 후 분리하는 과정에서line = int(X_train.shape[0])이라고 하셨는데 이 부분이 이해가 안갑니다! X_train.shape이 (29304, 15)일 때 int(X_train.shape[0])는 29304(데이터 수)를 말하는 것일까요?