묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분산분석 질문
안녕하세요 생각보다 할게 많아 복잡해서 몇가지 여쭤보고자 합니다!! 일원 분산 분석을 진행 할때 가장 먼저 정규성 검정을 해서 A,B,C,D라는 그룹이 있다는 가정하에 하나라도 0.05를 넘지 못하면 크루스칼 비모수 검정만 진행하고 끝내면 될까요?이원 분산 분석은 정규성 검정, 등분산 검정은 너무 어려워보여서 학습을 안할까하는데 여태껏 출제된적이 있을까요?일원 분산 분석과 이원분산분석의 사후검정 또한 학습을 하는 편이 좋을까요? (양이 너무 많아서 뺄수있으면 빼고싶은 마음에 여쭤봅니다)일원분산 분석에서 만약 등분산검정을 했는데 피밸류가 0.05를 못넘었다면 equal_var=False 이값을 어디에 넣어주어야하나요? 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 작업형2
import pandas as pd train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/8_2/churn_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/8_2/churn_test.csv") df=pd.concat([train,test],axis=0) df=pd.get_dummies(df) train=df.iloc[:len(train)].copy() test=df.iloc[len(train):].copy() target=train.pop('TotalCharges') from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val=train_test_split(train,target,test_size=0.2,random_state=0) from sklearn.ensemble import RandomForestRegressor rf=RandomForestRegressor(random_state=0) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) pred=rf.predict(test)unique수가 달라서 concat으로 실행했는데 오류가 납니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 제출
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형 2번 제출 시 result.to_csv("result.csv", index = False) 까지만 적어서 제출하면 되나요? 아니면 pd.read_csv("result.csv") 까지 작성해서 제출해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 할때
원핫인코딩 시 train, test 데이터를 pd.concat 로 병합하고 다시 분리하는 단계는 생략해도 되나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
melt함수질문
import pandas as pd를 불러온 상태라면pd.melt(df) 와 df.melt() 둘중에 골라서 써도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이트타임
자료엔 오류가 안났긴했는데 17 Feb 2024 이런 데이터가to_datetime 함수를 썼는데 만일 오류가 난다면이때 format에 어떻게 작성해야할까요? Feb << 이걸 어떻게 써야할지모르겠습니다
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
레이블 인코딩 질문 있습니다
처음에 set()함수 결과가 '주구매상품'에서만 고유값이 다르다고 결과가 나왔는데 라벨 인코딩에서는 왜 주구매 지점까지 같이 인코딩하나요?주구매상품만 인코딩하면 안되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
공부의 방향성에 대해 문의합니다.
안녕하세요. 다음주 빅데이터실기 준비중인 직장인입니다. (5*대)[현재상태]온라인강의는 1~114번까지 1회 정독 및 가능한 같이 코딩해봄( 모르는것이 있으면 풀이과정을 보며 방향성을 잡고 풀어봄, 60~70%정도는 풀이과정의 도움을 받음 )작업형2~3형은 대충 시험의 방향성을 잡히는것 같고, 작업형1형은 더 많이 풀어 보는수 밖에 없는것 같음[오늘 이후 공부의 방향성에 대한 질의]오늘 이후 8~8일 정도 어떤 계획을 가지고 공부를 진행해야 하는지요?시험시간 3시간에 대한 감이 없는데, 어떻게 풀어야 하는지는 생각이 나는데 함수 및 명령어 등이 생각이 않나는 경우 dir 및 help 기능을 참조하면 풀수 있는 시간인지요 3시간이?꼭 암기해야하는 부분은 무엇인지요?5*대이니 해도해도 자꾸만 단어등이 깜박깜박하네요.강사님의 좋은 조언 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의고사 오류
어제까지 모의고사를 잘 풀고 있었으나,오늘 새벽부터 갑자기 이러한 오류가 발생하고 있습니다. 원인과 해결법을 알 수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실제 문제에서 평가지표를 다 외워야할까요?
평가 지표 외우기가 힘든데 R-Squared만 외워도 합격하는데 문제가 없을까요?학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1모의문제2문제4
여기서 .columns를 안 붙여도 삭제가 되는데 붙이는 이유가 있을까요? 안 붙여도 되나요?
-
해결됨[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
답변 항상 감사드립니다. 질문 있습니다.
5회 작업형 2문제 입니다. 질문이 좀 됩니다.import pandas as pd import numpy as np X_test = pd.read_csv("X_test.csv") X_train = pd.read_csv("X_train.csv") y_train = pd.read_csv("y_train.csv") #-------------전처리-------------- xtrain = X_train.drop(columns = 'device_id') xtest = X_test.drop(columns = 'device_id') cond = y_train['repair_cost'] <= 0 ytrain = y_train[~cond] #-------------스케일링-------------- from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() xtrain1 = scaler.fit_transform(xtrain) xtest1 = scaler.fit_transform(xtest) #-------------모델링-------------- from sklearn.ensemble import RandomForestRegressor model = RandomForestRegressor() model.fit(xtrain1, y_train) pred = model.predict(xtest1) #-------------검증-------------- yhat = model.predict(xtrain1) a = np.corrcoef(yhat, y_train.values.flatten()) print(a)[질문]모델링 관련 질문입니다.저는 전처리 단계에서 ytrain 'repair cost'가음수이거나 0인 값은 빼는 것이 맞다고 판단하여 drop하였습니다.repair cost가 공짜일 순 있으나 음수인것은 말이 안되니까요.학부생일때도 결측값이나 해석하기 애매한 값에 대해서는mean이나 mode로 채우지 않고다 drop 했었는데, 빅분기 2유형에서도 이런 전략이 유효한가 여쭙는 질문입니다.(xtest 테이블에 있는 행들은 하나라도 drop하면 안되는 것으로 알고 있긴합니다.)(예를 들어, 주어진 xtrain '나라' 열에 '미국, 영국, 프랑스' 라는 3가지 값이 있고xtest '나라'열에 '독일, 러시아, 영국'라는 3가지 값이 있으면,원핫인코딩으로 전처리하고 모델돌릴시 에러가 뜨지않습니까?이런 에러 방지를 위해서라도 drop이 편한다고 생각합니다.)모델링 관련 질문입니다.2유형은 분류, 회귀 중 한 문제가 통으로 나온다고 알고 있습니다.찾아보니 LightGBM등 머신러닝 기법 종류는 다양한데,랜덤포레스트 Classifier와 Regressor로 2유형은 정리 가능한지 문의드립니다.당연히 장담은 못 주시겠지만,코딩 대한민국님 기출 강의 먼저 듣고시중에 나와있는 연습문제 풀다보니막히는 곳이 많아서 걱정입니다.(주로 전처리에서 막힙니다. 시중 연습문제들은 기출문제들 같이 데이터 전처리가 간단하지 않네요.)코딩 관련 질문입니다.특히 스케일링시,저는scaler = MinMaxScaler() xtrain1 = scaler.fit_transform(xtrain) xtest1 = scaler.fit_transform(xtest)이렇게 했는데,코딩대한민국님 강의에서는 scaler = MinMaxScaler()scaler.fit(xtrain)xtrain1 = scaler.transform(xtrain)xtest1 = scaler.transform(xtest)이런식으로 하시더라구요.비교해보니 출력값은 같아 보이는데, 차이점이 무엇인지 여쭙습니다.fit은 xtrain만 했는데transform은 xtrain뿐만 아니라, xtest도 알아서 되는 메커니즘이 이해가 안가네요.transform은 fit이 사전에 수행 안되도 되는 것일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 기출 작업형3 문제 1-3
강의시간 16:46 따로 test["design"]에 안넣고 변수로 지정하여서 예측을 진행한 후 rmse계산을 하였는데 결과가 다르게 나온 이유가 무엇일까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
앞서서 잘못저장된거 어떻게 취소하나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요df['출동시간'] = pd.to_datetime(df['출동시간']) df['도착시간'] = pd.to_datetime(df['도착시간']) df.info() 이렇게 했어야했는데 실수로 df['출동시간'] = pd.to_datetime(df['출동시간']) df['도착'] = pd.to_datetime(df['도착시간']) df.info() 이라고해서 0 소방서 100 non-null object 1 출동시간 100 non-null datetime64[ns] 2 도착시간 100 non-null datetime64[ns] 3 도착 100 non-null datetime64[ns] 이라고 나옵니다 실수로 도착이라고 저장된거를 어떻게 취소하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 답안 제출 시 질문입니다.
지금 기출 6회 작업형 1-1번 문제를 풀던 중 갑자기 의문이 생겼습니다. result = df.gruopby('소방서')['diff'].mean()에서 나온 결과물에서 바로 수치를 확인하고 답안을 제출해도 되는지?? 꼭 print(81)로 코드가 입력하여 결과물이 나온 상태로 확인하고 답안을 제출 해야하나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 문제2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 저는 파이썬 왕초보인점 먼저 밝힙니다 ㅜ df.loc[2000].mean() 을 실행했을 때 왜 저는 선생님처럼 안나오고 np.float64(100.735) 이렇게 나올까요? 똑같은 코드를 썻는데요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제1번 '상위' 오해 소지는 없을까요?
문제 1번에서 상위 10개 데이터라고 하는데, 언젠가 풀어본 문제에서 "상위 10개"가 값이 큰 순서대로 상위 10개가 아니라, 그냥 주어진 데이터에서 상위 10개를 뽑는 경우가 있었어서 처음에 풀 때 그냥 주어진 값에서 index 0~9까지를 추출했습니다. 근데 풀이내용을 보니, 내림 차순 후 진행하시더라구요...혹시 실제 문제에서 이런 오해의 소지가 있을만한 건 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
필수 인강 리스트
안녕하세요. 현재 커리큘럼에따라 2과목까지는 다 들었는데 시험일정이 촉박하여 모든 인강을 듣고, 실습 연습까지 할 수 는 없을거 같은데필수 인강 리스트와 필수 문제리스트를 추천해주실 수 있으실까요?데이터분석을 대학교때 어느정도해서 기초는 있는 상황입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
proba와 문자형
proba 사용 시에 [:,1]을 사용하는건 문제마다 다른건가요? 정확히 어떤 문제에 [:,1]을 사용하는지 예시와 함께 알고 싶습니다. 또한f1score에서 pos_lable="A"라고 말씀해주셨는데 이 부분도 정확히 이해가 안갑니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 볼때 코랩처럼 약간 정보제공이 되는건가요?
이런식으로 코딩 하다보면 밑에 정보가 나와서 도움이 되는데, 시험환경에선 저런게 없다고 보면되죠??