묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
독립성검정에서 correction 옵션과 관련하여 문의드립니다.
안녕하세요.제목과 같이 독립성검정의 경우 chi2_contingency 함수를 사용하는데 공부하다 보니 chi2_contingency(table, correction = True) 이렇게 되어있는 글을 보게 되어서 검색하여보니 correction 옵션은 자유도와 관련된 부분이라고 해서 자유도가 1인 경우에는 True이고 , True가 기본값이긴 하지만 1보다 클 경우에는 False를 사용해야 한다고 하는데 예시 문제를 살펴보면 ddof = 1인 경우에만 있었는데 혹시 실기에서도 해당 부분을 고려해야 할까요 ? 감사합니다 :)
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
concat
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요아래처럼 concat으로 한 이후에는 model_selection시에train_oh와 test_oh가 더 나오진 않나요??X_tr, X_val, y_tr, y_val = train_test_split(train_oh, target, ,,) 이 되지는 않는지요?? print(train.shape, test.shape)data = pd.concat([train, test], axis=0)data_oh = pd.get_dummies(data)train_oh = data_oh.iloc[:len(train)].copy()test_oh = data_oh.iloc[len(train):].copy()print(train_oh.shape, test_oh.shape)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
범주형데이터 전처리 관련 문의드립니다.
안녕하세요.EDA 단계에서 수치형컬럼들의 기초통계량을 해보니 SeniorCitizen이 0과 1로 나뉘어있는거 같아 변수 확인 후, 해당 컬럼을 범주형으로 변환 후, 작업하였는데 이렇게 변경하여 작업해도 괜찮을까요 ?범주형으로 변경 후, 작업하였을 때# 원핫인코딩 : 946.3475544795037 946.7024808036148# 레이블인코딩 : 951.0960435538027 952.7925407798712다음과 같이 결과 값이 나왔습니다.감사합니다 :)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 탐색적 데이터 분석
작업형2에서 전처리 과정 들어가지전, EDA 수행 시 꼭 확인해야하는 것들이 어떤것이 있을까여?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1-2 질문
# your code import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv") cols1 = df.columns[df.isnull().sum() >= len(df) * 0.3] df = df.dropna(subset=cols1) cols2 = df.columns[(df.isnull().sum() < len(df) * 0.3) & (df.isnull().sum() >= len(df) * 0.2)] for col in cols2: df[col] = df[col].fillna(df[col].mode()[0]) print(sum(df['f3'] == 'gold'))문제에서 결측치가 30% 이상인 컬럼을 찾으라 했는데, 저는 이렇게 조건에 해당하는 컬럼들을 리스트 형태로 구해서 subset에 넘겨주었는데, 선생님 풀이를 보니 subset=['f1'] 이런 식으로 조건에 해당하는 컬럼의 이름을 직접 명시하셨더라구요..!이런 문제를 풀 때 조건문을 이용해서 조건에 해당하는 컬럼들을 일괄적으로 선택할 필요는 없나요?제가 아직 이 시험의 문제 유형을 잘 파악하지 못했는데, 이 시험이 혹시 코딩테스트를 예로 들면 "2+3의 값을 출력하시오" 라는 문제의 답을 print(2+3)이 아닌 print(5)로 써도 답은 맞으니 정답 처리가 되는 방식인가요?감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모델, 평가, 예측
예를 들어 평가지표가 여러개인 경우 코드는 다 작성하고 바로 예측하면 되나요?? 평가랑 예측의 상관성을 잘 모르겠습니다. 보통 코드에 평가 지표를 여러개 작성하는데 그게 다 반영돼서 예측하는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실행 실패했는데 봐주실 수 있으실까요? ㅠㅠ
안녕하세요 퇴근후딴짓님! 다름 아니라 안내대로 작성했는데 계속 실행실패가 나와서 왜 그런것인지 궁금합니다 ㅠㅠ.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수치형 자료 선택
2유형 개념 강의 중 classification(분류) 문제 질문있습니다. label 인코딩 할 때 범주형 자료를 선택하기 위해cols = train.select_dtypes(include='object')를 사용한다고 했습니다. 그 후 Min-Max 스케일링을 진행할 때 강의에서는 리스트 형태로 cols 변수에 직접 수치형 컬럼을 입력했지만cols = train.select_dtypes(exclude='object') 또는 include=['int','float'] 으로도 선택할 수 있을 것을 것이라 생각해서 실행했더니 에러가 발생합니다.ValueError: Boolean array expected for the condition, not int64 제 방법대로 진행했을 때 cols에 선택된 데이터를 보면 강의에서 직접 리스트 형태로 입력한 컬럼에 추가로 'id' 컬럼이 더 선택된 것으로 보입니다. 이렇게 진행했을 때 왜 에러가 발생하는지, 에러가 발생하지 않아도 id 컬럼이 추가로 선택된 상태로 진행했을 때 문제가 있는지 질문 드립니다! 강의 내용cols = ['age', 'fnlwgt', 'education.num', 'capital.gain', 'capital.loss', 'hours.per.week'] def get_data(): train_copy = train.copy() test_copy = test.copy() return train_copy, test_copy train_copy, test_copy = get_data() from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() display(train_copy[cols].head(2)) train_copy[cols] = scaler.fit_transform(train_copy[cols]) test_copy[cols] = scaler.transform(test_copy[cols]) display(train_copy[cols].head(2))제 코딩 내용은 위 코드에서cols = ['age', 'fnlwgt', 'education.num', 'capital.gain', 'capital.loss', 'hours.per.week']부분을cols = train.select_dtypes(include=['int','float']) 또는 cols = train.select_dtypes(exclude='object')이렇게 바꿨습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3 소문제3번 등분산
등분산이라는 명확한 언급이 없어서 등분산이라고 가정하고 t검정을 수행하신건가요??분석 흐름 때문에 등분산이라고 생각하셨다고 하는데 구체적인 이유가 궁금합니다..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
비교 연산자 == 의 해석이 어려워요
19강 작업형1 모의문제2 문제 6번에서 df['age']==round(df['age'],0) 위의 코드가 어떤 방식으로왼쪽과 오른쪽 값이 같으면 '정수형'이고 다르면 '소수점'이라는 판단을 내릴 수 있건지 이해하기가 어렵습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 프레임이 안만들어지네요
설명 주신대로 코드를 짜보았는데 데이터 프레임 출력이 되지 않네요. 다음 사진의 경고문이 뜨는데 이거 때문인건가요? 새로고침해봐도 안되네요. 해결 방법이 궁금합니다감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
object형 컬럼 카테고리 비교
강의에서 카테고리 비교할 수 있는 응용 코드를 알려주셨는데요, train과 test의 범주형 컬럼의 기초통계값을 확인해서 unique수 차이가 많이 난다면 카테고리 비교하는 과정없이 그냥 무조건 concat으로 합치고 레이블 인코딩 후 다시 분리해도 되나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오징어게임 챌린지
쿠폰 신청을 하려고 했는데 사용 가능 수량이 초과되었다고 문구가 뜹니다.혹시 추가 쿠폰 지급 계획은 없으신지 문의드립니다.
-
미해결비전공자를 위한 가장 쉬운 데이터분석 입문
파이썬 다운로드 링크
https://dsstudy.tistory.com/8?category=830915여기에 들어가면 '권한이 없거나 존재하지 않는페이지입니다.' 라고 뜹니다.다운 다능한 링크 알려주세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
하이퍼파라미터 필수여부
작업형 2번 에서, 하이퍼 파라미터 값은 필수로 넣어줘야 하나요?print로 성능 하나하나 체크 하고 넣어줘야하나요? 굳이 안넣더라도 채점에 영향이 없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
17강 판다스 시계열데이터 풀이에서 100일째 되는 날
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요여기서 왜 가운데에 10이 생긴걸까요? 제가 100일을 쓰기도 전에 10일 쓰고 모르고 실행하긴했는데 그래서 그런걸까요?//...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델 & 평가 과정 질문
랜덤포레스트 진행과정에서 전 강의에서는 pred_proba = rf.predict_proba(X_val) 쓰고, roc_auc = roc_auc_score(y_val, pred[:,1]) 이렇게 하셨는데 이번 강의에서는 roc_auc_score(y_val, pred_proba[:,1]) 로 표현하셨는데 어떤 차이로 인해서 다르게 쓰셨는지 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7. 예측 및 결과파일 생성에서 오류가 생겨요
다중분류(6회) 문제입니다.선생님 해설지처럼 똑같이 쳤는데 마지막에 자꾸 오류가 뜨네요 왜그런지 모르겠어요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제1 책관련
작업형2모의문제 1 같은 경우는 도서에 따로 문제가 없는 것일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 문제1
영상에서는 df.quantile(.75)를 실행했을 때 오류가 나지 않았는데 저는 오류가 나서 어떤 부분이 잘못되었는지 여쭤봅니다.