묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩에 대해 질문 드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요. 2유형 문제에서 원-핫 인코딩을 진행할 때, 기존에는 train과 test 데이터를 먼저 합친 뒤 pd.get_dummies()를 적용하고, 이후 다시 분리하는 방식으로 학습했었습니다. 그런데 최근 기출문제 풀이를 보면, train과 test를 따로 인코딩하는 경우도 종종 보이더라고요. 혹시 범주의 유니크 값 개수가 동일하다면, 굳이 합치지 않아도 인코딩을 개별적으로 진행해도 무방한 건지 궁금합니다. 인코딩 처리 방식에 대해 혼동이 있어 문의드립니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 6회 작업형 3
12:58 2번 문제에서앞의 부분, 데이터에서 'solar'와 'o3'를 고정한 상태에서 'wind'의 세기가 증가함에 따라~~이 부분은 무시해도 되는건가요?? wind의 p-val 값은 구할 수 있는데 풀이 당시 앞부분의 의미를 몰라서 무엇을 구해야 할지 몰랐었습니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 질문!
성능을 평가할 때 root_mean_squared_error 코드를 시험환경에서는 못쓰는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 기출 2번
from sklearn.ensemble import RandomForestClassifiermodel = RandomForestClassifier(random_state=0)model.fit(X_tr,y_tr)pred = model.predict(X_val)f1_socre = f1_score(y_val,pred,average='macro')print(f1_score) 로 작성했더니 <function f1_score at 0x7cb537c5f6a0>로 출력이 되는데 이건 무슨 값일까요? 어떻게 해야 선생님처럼 값이 나올까요>
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse 사용시
안녕하세요 3유형에서 rmse로 성능측정시 원래는 mse**0.5해서 계산하고 있었는데퇴근후딴짓님 어떤 영상에서는새로 패키지가 추가됬다며 from sklearn.metrics import root_mean_squared_error해서 root_mean_squared_error(y_val, pred)이렇게 사용하더라구요 실제 시험환경에서 위와같이 사용해도 되나요?
-
해결됨빅데이터분석기사 실기 R 올인원: 3주에 끝내는 완벽 대비
제1유형 실전문제 풀이(1)에서요
안녕하세요.완전 초보라서 헤매고 있는데요. df <- read.csv("boston.csv") 라고 입력했는데, 라고 나옵니다.. 뭐가 잘못된 걸까요? 경로에 파일이 있는것 확인했는데요.. file(file, "rt")에서 다음과 같은 에러가 발생했습니다: 커넥션을 열 수 없습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
roc_auc_score 문의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요7. 머신러닝 학습 및 평가(분류) 11분19초 부분입니다.안녕하세요.roc_auc_score로 pred와 y_val간 비교를 통해 roc-auc 스코어를 내는 부분에 질문이 있습니다. roc_auc = roc_auc_score(y_val, pred[:,1])여기서 y_val의 경우에 프린트해보면 각 항에 <=50K 혹은 >50K 라는 값으로 이루어져 있습니다.pred는 array의 집합 [0.1 , 0.9] 등으로 이루어져 있는데 pred[:, 1]을 통해서 '>50K' 부분만 따로 추출해내는 점은 이해가 됩니다. 제가 궁금한것 여기서 y_val의 값, 즉 <=50K 혹은 >50K이 '<=50K'는 0 '>50K'는 1으로 정의가 되어있는 건지요? 특별히 정의를 한것 같지는 않습니다. (물론 문제에서는 50만불 이상이 양성이라고 언급은되어있습니다만..) 혹시 rf.classes_ 에서 출력되는 ['<=50K' '>50K'] 값의 의미가dataset의 y값 전체가 '<=50K'= 0, '>50K'= 1 라는 의미로 이해를 하면되는 것일까요? (전체y(타겟)의 넘버가 rf클래스의 인덱스 값에 따르는 것인지?)
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[실습 체험 환경] root_mean_squared_error 오류
안녕하세요 실습 체험 환경에서 작업 중인데 from sklearn.metrics import root_mean_squared_error해당 문구를 사용하면 아래와 같이 뜹니다 .. 버전이 달라 더이상 사용을 못하는 걸까요 ?dir(sklearn.metrics) 해서 목록을 살펴보면 mean_squared_error 는 다 있는데 , root_mean_squared_error 이 함수만 없습니다 ... 왜 그런걸까요 ㅠㅠ make: *** [py3_run] Error 1Traceback (most recent call last): File "/goorm/Main.out", line 98, in <module> from sklearn.metrics import root_mean_squared_errorImportError: cannot import name 'root_mean_squared_error' from 'sklearn.metrics' (/usr/local/lib/python3.9/dist-packages/sklearn/metrics/__init__.py)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3(2025)
안녕하세요! 빠른 반영 감사합니다 ㅠㅠ!대체로 질문해석이 좀 어려운데요..이번꺼 보면서 궁금한게 들어서 질문 드립니다!*시험용 공부만 해서, 이론개념이 거의없는 점 참고바랍니다..! 1) ① - 분산을 구해서 조건에 맞는(단, ~) 계산을 한게 검정통계량인걸까요..?아니면 결국 핵심이 '분산에 차이가 있는지를 알아보기 위해' 이기 때문에 분산을 통해 계산을 하면 되는것인지 궁금합니다. 2)③ - '정규성,등분산 검정 후' 라는 언급이 없으면 무조건 등분산 true로 두고 진행하면 될까요?*cond1 샤피로검정해보니 0.03으로 귀무가설 기각이여서 문의드립니다..!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 train + test
안녕하세요 강사님. 머신러닝 학습 및 평가(회귀) 강의 관련 질문 드립니다.인코딩을 위해 train + test 데이터를 합친 후, 다시 분리시키는 방법을 알려주셨는데요,train / test 데이터 개수가 불균형일 때만 이렇게 진행하면 될까요? 합치고 분리하지 않고, 그냥 바로 인코딩 진행해도 문제가 없을지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
고유값이 가장 많은 컬
print(a.nunique().sort_values(ascending=False).idxmax()) 코드를 이렇게 작성해도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
체험환경 제3유형
체험환경 제3유형 새로나온 강의 잘들었습니다. 감사합니다. 하나 여쭤보고싶은데질문2번에서합동분산추정량 공식이분모에 자유도합친 후 -2는 안해주나요? # ((자유도1 분산1) + (자유도2 분산2)) / (자유도1+자유도2 ) - 2 n1 = sum(cond1) n2 = sum(cond2) result = (((n1-1) var1) + ((n2-1) var2)) / ((n1-1) + (n2-1)) print(round(result,3))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 전처리2 강의 질문
안녕하세요 강사님 :) 스케일링 방법 강의에서 아래 코드는 외울 필요가 없다고 말씀 주셨는데요,# 데이터를 매번 새롭게 불러오기 위해 함수로 제작 함 def get_data(): train_copy = train.copy() test_copy = test.copy() return train_copy, test_copy 시험 볼 때 스케일링을 한 가지 하는 게 아니라 세 개 다 한다고 가정했을 때,copy 하지 않으면 처리 결과에 영향을 미치지 않나요? 어떻게 하면 될지 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
체험환경 제2유형
체험환경 제2유형랜포로 한번에 풀기 진행하고있는데요. import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")# 사용자 코딩# print(train.info())# print(test.info()) # 2482target = train.pop('총구매액')train = pd.get_dummies(train)test = pd.get_dummies(test)train, test = train.align(test, join='left', axis=1)from sklearn.model_selection import train_test_splitx_tr, x_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0)from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegressor(random_state=0)rf.fit(x_tr, y_tr)pred = rf.predict(test) rf.fit에서 계속 에러가 납니다. 시험볼때도 아래와 같이 계속 에러가 날 것 같은데 방법없을까요? ㅜ_ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
안녕하세요.2유형에서 어떤 문제든 원핫인코딩(get_dummies)으로만 진행해도 될까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기체험환경 변경된 문제풀이
안녕하세요. 실기체험환경에서 문제들이 변경된것 같은데2유형도 결측치가 있어서 처리해야 할 것 같은데 하는 방법을 몰라서요 변경된 문제들 문제풀이 해주실 수 있을까요??
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
최근 변경된 시험 체험 환경 예시문제 관련 문의드립니다.
먼저 양질의 강의를 제공해주셔서 감사합니다.코딩 대한민국님의 유튜브 채널에서 데이터 전처리 관련 판다스 100제로 도움을 받고인프런 강의를 수강하게 된 '제10회 빅분기 실기 시험 수험생'입니다. 최근 데이터자격검정 사이트 공지에 제10회 빅데이터분석기사 실기 시험 공지가 올라와서 확인 후시험 환경 체험을 이용하던 중 예시문제가 변경되었다는 것을 알게 되었습니다.관련해서 수험생분들의 후기를 보니 아래와 같은 내용이 있었습니다.- 1유형 예시문제: 지시문이 조금 더 구체적으로 변경- 3유형 예시문제: 난이도 상승 혹시 변경된 시험 체험 환경 예시문제를 학습하면서 어려운 부분에 대해 질문을 드려도 될지 조심스럽게 문의드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
전처리 방식과 모델 성능 차이
7회 2유형을 전처리 방식을 원핫인코딩과 레이블인코딩으로 나눠서 해보았는데,rmse가 원핫인코딩의 경우 38만정도가 나왔는데, 레이블인코딩의 경우 2100정도가 나옵니다. 전처리 방식에 따라서 이렇게 큰 차이가 날 수가 있는건가요..? 아니면 모델 학습단계에서 제가 오류를 범한걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 질문 드립니다.
logit('Survived ~ C(Gender) + SibSp + Parch + Fare')C(Gender)와 Gender를 미리 원/핫 인코딩을 한거랑 동일한 것인지 궁금합니다.원/핫 인코딩 후 logit('Survived ~ Gender + SibSp + Parch + Fare')
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
print(len(df[cond1 & cond2 & cond3])) 출력시 해당 에러 발생 > 'float' object is not callable
안녕하세요.61강 4회 기출유형 (작업형 1) 문제를 풀었을 경우 아래와 같은 에러가 출력되네요'float' object is not callable 참고로 코드는 이렇게 작성하였습니다. import pandas as pd df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/4_1/basic1.csv") df.head()