묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 강의중에
모의문제 1 풀기전에는 concat을하고 분리까지했었는데모의문제1에서 인코딩할때는 왜 concat을 안쓰고 바로 한건가요??이해가 잘 안됩니다 개념이
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 독립표본검정 / 카이제곱 적합도 검정
가설검정의 독립표본 검정과 카이제곱 적합도 검정을 서로 대체하여 사용할 수 있는지 문의드립니다! 독립표본도 서로 다른 2개의 집단 (표본)의 차이를 확인하는 것 처럼 카이제곱 적합도 또한 서로 다른 2개의 집단 (관측, 기대치)의 차이를 구하게 되는데, 그럼 이때 서로 대체하여 쓸 수 있는지 해서 여쭤봅니다!(물론 카이제곱 적합도 예제에서 독립표본 구하는 맨휘트니를 적용하니깐 값이 다르게 나오긴 합니다...^^)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 3 필수 강의
합격만 목표로 했을 때 작업형 3에서 필수로 들어야 하는 강의는 무엇인지 알려주세요 !
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요! section21강의 문의드립니다!
안녕하세요, section21.Quiz부분에 대한 해설 및 강의를 듣고싶은데 어디서 들을 수 있는지 문의드립니다! 모의문제도 아니고 모의고사도 아닌것같더라구요! ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f1 스코어는 macro옵션을 다중분류일때만 넣으면되는건가요?
f1 스코어는 macro옵션을 다중분류일때만 넣으면되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
random_state=0, random_state=123 차이가 발생합니다. 어떤값을 넣어야 하나요? 최적값이 따로 있나요?
df = pd.DataFrame({ 'f1': [2, 3, 5, 7, 11, 13, 17, 19, 23, 29], 'f2': [30, 28, 26, 24, 22, 20, 18, 16, 14, 12], 'target': ['A', 'A', 'A', 'B', 'B', 'A', 'A', 'A', 'A', 'B'] }) y_train = df.pop('target') x_tr, x_val, y_tr, y_val = train_test_split(df, y_train, test_size=0.5, random_state=123) print(x_tr.shape, x_val.shape, y_tr.shape, y_val.shape) model_rfc = RandomForestClassifier(random_state=42) model_rfc.fit(x_tr, y_tr) y_proba_val_rfc = model_rfc.predict_proba(x_val) print(y_proba_val_rfc) roc = roc_auc_score(y_val, y_proba_val_rfc[:,1]) print(roc) (5, 2) (5, 2) (5,) (5,) [[0.29 0.71] [0.92 0.08] [0.7 0.3 ] [0.74 0.26] [0.45 0.55]] 1.0 ------------------------------------------------------------------------- df = pd.DataFrame({ 'f1': [2, 3, 5, 7, 11, 13, 17, 19, 23, 29], 'f2': [30, 28, 26, 24, 22, 20, 18, 16, 14, 12], 'target': ['A', 'A', 'A', 'B', 'B', 'A', 'A', 'A', 'A', 'B'] }) target = df.pop('target') X_train, X_val, y_train, y_val = train_test_split(df, target, test_size=0.5, random_state=0) clf = RandomForestClassifier(random_state=42) clf.fit(X_train, y_train) y_pred = clf.predict_proba(X_val)[:,1] print(y_pred) # 예측값 roc_auc_score(y_val, y_pred) # 정확도 평가 [0.68 0. 0.25 0. 0.26] np.float64(0.25)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 관련해서 질문드립니다
1분내로 코드를 실행해야 한다는건 알고 있는데요, 이 부분이 시험치면서 직접적으로 어느 부분에 영향을 주나요?? 채점할때 제 코드가 1분내로 실행이 안되면 감점인건가요? 아니면 그냥 제가 문제풀때 1분이 지나면 자동으로 실행결과가 사라지는 부분이 불편한건가요?ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Data Scaling은 Skip하나요?
작업형2-3 문항의 강의를 보면 'id' 항목만 삭제하고학습/검증 Data 분리 後 바로 모델평가로 들어가는데요 수치형에 대한 Data Scaling 이 Skpi되는 이유가 뭔지 궁금해서 MinMaxScaler또는 StandardScaler를 해줘야 하는거 아닌가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
알려주신대로 캐글에서 연습하려는데 자료주소가 이상한가봐요
강의에서 알려주신대로 캐글에서 많은 연습문제를 접해보려고 하는데데이터 주소에 에러가 자꾸 뜨네요 어떻게 해야 캐글 연습을 해볼수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1, 3 풀 때 질문 있습니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 다름이 아니라 작업형 1, 3번은 답변을 적는 페이지가 따로 있는데코드 적는 풀이도 채점을 받게 되는 건가요? 강의에서 보면 중간 print들은 지워주라는 말씀을 몇 번 하셨는데꼭 답변 부분만 print로 출력해야 하는지,중간 과정은 출력하면 안되는지,또 혹시라도 답변 부분을 print로 확인 후 주석 처리 시 감점 요인인지 궁금합니다. 저는 제출한 답안만 평가 대상이라고 생각했는데 저의 풀이과정 코드도 평가 대상일까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 8회 3유형 문제 1-3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요강의가 누락된거같은데 어디서 볼 수 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3 (신버전) 질문입니다.
예시문제 작업형3 (신버전) 문제의 제공된 데이터에서로지스틱 회귀 모델 생성시 C()로 묶어서 처리해야하는 데이터는Survived, Pdass, Gender, Embarked 뿐인게 맞나요??문제에는 Gender밖에 사용되지 않았지만 만약 위의 변수들도 포함해서 회귀 모형을 만들라는 지시가 있었을때 C()로 묶는게 맞는지 여쭤봅니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형변수 인코딩
범주형 변수에 대해 라벨인코딩만 하시는데pd.get_dummies로 그냥 원핫인코딩 하면 안되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터 분석기사 실기 체험 환경 질문입니다.
작업형 1, 3과 같이 문제를 풀이하는 칸과 답안을 제출하는 칸이 다르게 있는 경우 문제 풀이에서 답안 제출 칸으로 넘어가면 문제 풀이칸에서 적어놨던 코드들이 날아가더라구요.. 메모장도 문제풀이에서 적어놨던 내용이 답안 제출 칸으로 넘어가게 되면 리셋되는 것 같아서 이 경우 소문제의 답을 모두 외우고 답안 제출 칸으로 넘어가야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
삭제예정인 23섹션은 공부하지 않아도 되나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 질문
문제에 제시해주신 데이터를 보면, education_level, marital_status 컬럼에서 unknown이 확인되는데, 실제 시험에서 이런 값은 결측치로 간주하지 않아도 되는걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시나공 교재도 구입해서 ..일단 홈페이지 자료실에서 다운받았는데
시나공 교재도 구입해서 ..일단 홈페이지 자료실에서 다운받았는데폴더를 다운받았어요 근데 봐도 어떻게 자료를 열어서 작업하는지 전혀 모르겠네요선생님 구글랩 링크를 알려주시면 거기에 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩, 라벨인코딩 중 하나 결정해야할때
안녕하세요. 범주형 변수 인코딩시 원핫인코딩 또는 라벨인코딩을 활용하게 되어있는데 둘중 아무거나 활용해도 상관이 없나요? 아니면 범주의 숫자가 너무 많을 때는 라벨인코딩을 하는 것이 더 성능에 좋은가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출7회-작업형2에서 random_state = 0 과 42 차이에 대한 질문
7회기출 풀면서,랜덤포레스트회귀로 풀었는데. R2값이 마이너스라고 놀랐고. 아래는 random_state 설정별 결과값인데, 0이 더 좋은 결과를 낸 것이라고 보면 되는건가요?(R2값을 구글 제미나이에 물어보니, 심각한 문제라고 설명해주긴 하는데. 무시해도 되는건지..)random_state=0 으로 하면.R2값 : -0.10286RMSE : 385,935 이고. random_state=42으로 하면.R2값 : -0.05894RMSE : 400,843 입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제1
작업형2 모의문제1 풀이중08:04 #baselinecols = train.select_dtypes(include='object').columnscolstrain = train.drop(cols, axis=1)test = test.drop(cols, axis=1) print(train.info(),test.info())위와 같이 실행을 하면 test 데이터의 object 칼럼은 삭제가 안된것 같아보여서요아래와 같이 추가로 한줄 더 안써도 되는건가요??cols = test.select_dtypes(include='object').columns