묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨빅데이터분석기사 실기 R 올인원: 3주에 끝내는 완벽 대비
제6회 기출복원문제 제2유형
제6회 기출복원문제 제2유형에서 enrollee_id 변수도 불필요한 값으로 간주하고 삭제해도 될까요? 또한 팩터로 변환한 변수의 level을 확인해보면(enrolled_university, education_level 등) 공백 문자값이 많이 보입니다. 해당 값들에 대해서도 제거 처리 없이 진행해도 되는지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
from sklearn.metrics import SCORERS import오류 발생
위와 같이 SCORERS를 import할때 오류가 발생합니다. 코랩환경입니다. 오류 해결 방법이 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
귀무가설/대립가설 설정이 헷갈립니다.
[문제] 빅데이터 분석기사 실기 언어 선택에 따라 합격 여부를 조사한 결과이다. 언어와 합격 여부는 독립적인가? 가설검정을 실시하시오. (유의수준 0.05) 귀무가설(H0): 언어와 합격 여부는 독립이다. 대립가설(H1): 언어과 합격 여부는 독립이지 않다. 여기서, 이 문제는 독립성 검정이기 때문에 귀무가설은 독립이다! 라고 설정하는건가요? 보통 귀무가설이 알려진 사실, 대립가설이 내가 증명하고자 하는 사실인데, 독립성 검정이기에...내가 증명하고자 하는 사실이 "두 데이터는 독립이다."라서 이게 대립가설인것같이 느껴집니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1에 정답
정답이 f1인데, 풀이에 반드시 print문까지 작성해야 답인가요? df.isnull().sum()을 사용하면 눈으로 f1이 답인걸 알 수 있으니 그냥 정답란에 f1만 적으면 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 관련 질문입니다.
안녕하세요,혹시 빅분기 실기 1유형 문제가 큰 문제 하나 안에서 작은 문제 3개로 구성되는 형태인가요? 이게 문제 구성이 고정적인건지 시험에 따라서 소문제가 2개나 4개로 바뀌어서 나올 수도 있는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1_모의문제1_문제1
왜 값이 다른지 여쭤봅니다 잘못작성된 것이 있을까요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 문제 3번_형변환
강의랑 똑같이 코딩한것 같은데 왜 답이 float형으로 나오는 걸까요???
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
단일표본검정(wilcoxon검정)
stats.wilcoxon(df['무게']-120, alternative = 'less')에서 alternative = 'less'가 이해가 안됩니다.관측값(실제값)이 왜 더 작아야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 연습문제 섹션 3 질문
섹션3. 항공권 가격 예측 시, 탐색적 데이터 분석과정에서 describe로 unique 카테고리가 동일하지 않다면 이 강의에서는 데이터를 삭제시켰는데, 삭제시키지 않고, df = pd.concat([train, test])df = pd.get_dummies(df)train = df.iloc[:len(train)]test = df.iloc[len(train):] 이 과정을 사용해도 괜찮나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
84강 csv파일 링크
시험환경의 문제가 변경되었는지 파일을 찾을수없습니다. 어떻게 하면 될까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
연습문제 3형도 ~~
바쁘시겠지만 올려주시면 감사하겠습니다 ㅠㅠ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f1_score
안녕하세요 항상 강의 잘 보고있습니다 몇가지 궁금한게 생겨서 질문하고싶은데 전에 강의 들을때 f1스코어 에서 pos_label을 붙이셨던걸 봤는데 이걸 붙이고 안붙이고는 어떻게 판별해야 할까요?from sklearn.metrics import f1_scoref1= f1_score(y_val, pred[:,1], pos_label='>50K') average=macro는 왜 붙이는건지 알수 있을까요? 혹시 macro나 pos_label처럼 뒤에 따로 붙여야 하는 평가지표가 있다면 또 알려주실수 있을까요?감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
하이퍼파라미터 튜닝 default값 문의
안녕하세요.하이퍼파라미터 튜닝 관련 질문있습니다. 강의에서는 XGBClassifier 하이퍼파라미터 튜닝값 의 기본값이 max_depth=3, learning_rate=0.1 이라고 말씀해주셨어요. 제 학습환경도 동일하게 코랩인데, 기본값이 다른 것 같아요. 결과를 비교해보니, 저는 max_depth=6, learning_rate=0.3이 기본값인 것 같고, gpt에 물어봐도 동일한 답변이 나옵니다. (아래 gpt답변 참고) 강의 촬영시점과 달라서 그런걸까요?시험환경에서는 기본값이 또 다를까요? 그러면 시험환경에서는 기본값 의존하지말고 그냥 하나하나 값을 직접 찍어보는게 좋을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
소괄호, 중괄호, 대괄호 사용법
(), {},[] 사용법 알려주세요. 너무 헷갈려요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
''와 "" 차이
df['메뉴'].isin(["녹차"])'메뉴', "녹차" 작은따옴표와 큰따옴표 차이가 어떻게 다른건가요??
-
해결됨[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
원핫인코딩 이후 칼럼 불일치 문제
체험환경 2유형을 푸는데 원핫인코딩이후에 칼럼수가 달라져서 from sklearn.preprocessing import MinMaxScalerscaler = MinMaxScaler()x_tr_scaled = scaler.fit_transform(x_tr)x_val_scaled = scaler.transform(x_val)#test2_scaled = scaler.transform(test2) >>>> 여기서 칼럼불일치로 에러가 납니다어떻게 해결해야하나요? 추가로, 원핫인코딩이후에 정규화를 꼭 해줘야하는지도 궁금합니다.원핫인코딩하면 0,1뿐이라 이미 정규화가 된게 아닌가해서요~
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
함수 오류 모르겠어요
listbox = [15, 46, 78, 24, 56] def min_max(data): mi = min(data) ma = max(data) return mi, ma a, b = min_max(listbox) print(a,b)--------------------------------------------------------------------------- TypeError Traceback (most recent call last) /tmp/ipython-input-3854204748.py in <cell line: 0>() 5 return mi, ma 6 ----> 7 a, b = min_max(listbox) 8 print(a,b) /tmp/ipython-input-3854204748.py in min_max(data) 2 def min_max(data): 3 mi = min(data) ----> 4 ma = max(data) 5 return mi, ma 6 TypeError: max() takes 0 positional arguments but 1 was given학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!최대값, 최소값 구하는데 쌤하고 똑같이 했는데 왜 오류가 나지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
melt 대괄호
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요melt함수에서 [ ] 대괄호를 붙인것도 안붙인 것도 있는데, id_vars는 꼭 붙인다 처럼 정해진 것이 있나요? var_namevalue_varsvalue_name
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
f1 score
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요target 값이 문자형일 경우 양성 레이블을 설정해줘야 하는 평가지표는 f1 score 밖에 없는 건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨인코딩을 했더니 F1 Score가 1.0이 나옵니다..
실제 시험에서 너무 정확한 점수(높은)가 나오면 과적합을 의심해야 할까요?import pandas as pd # 다중분류 문제 train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/drug_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p2/drug_test.csv") target = train.pop('Drug') # train, test 둘다 결측치 없고, 종류수 같음 cols = train.select_dtypes(include='object').columns # baseline # train = train.drop(cols, axis=1) # test = test.drop(cols, axis=1) # one-hot # train = pd.get_dummies(train, columns = cols) # test = pd.get_dummies(test, columns = cols) # Label from sklearn.preprocessing import LabelEncoder for col in cols: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) # 학습 데이터 분리 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split( train, target, test_size=0.2, random_state=0 ) # 모델 학습 from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier(random_state=0) model.fit(X_tr, y_tr) pred = model.predict(X_val) # 모델 성능평가 from sklearn.metrics import f1_score score = f1_score(y_val, pred, average='macro') print("F1 Score: ", score) # baseline F1 Score: 0.5535714285714286 # one-hot F1 Score: 0.8809523809523809 # Label F1 Score: 1.0 # 모델 예측 pred = model.predict(test) pd.DataFrame({ 'pred': pred }).to_csv('result.csv', index=False) pd.read_csv('result.csv')