묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
pvalue 가 유의하다 ?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 pvalue 가 유의수준 0.05보다 작으면 귀무가설을 기각하고 대립가설을 채택하는데 이 경우가 pvalue 가 유의하다라고 이해하면 되는건가요? 대부분의 케이스에서?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 과정 질문드립니다.
target = train.pop('총가스사용량') #원핫인코딩 # train = pd.get_dummies(train) # test = pd.get_dummies(test) #라벨인코더 from sklearn.preprocessing import LabelEncoder cols = train.select_dtypes(include = 'object').columns for col in cols: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) #데이터 분리 from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size = 0.2, random_state = 0) # 랜덤포레스트 from sklearn.ensemble import RandomForestRegressor rf = RandomForestRegressor(random_state = 0) rf.fit(X_tr,y_tr) pred = rf.predict(X_val) #라이트gbm # import lightgbm as lgb # lg = lgb.LGBMRegressor(random_state=0, verbose=-1) # lg.fit(X_tr,y_tr) # pred = lg.predict(X_val) #평가지표(RMSE) from sklearn.metrics import root_mean_squared_error rmse = root_mean_squared_error(y_val, pred) rmse #라벨인코더 - 랜덤포레스트 > 959.3866443164056 #원핫인코딩 - 랜덤포레스트 > 960.485846380754 #원핫인코딩 - 라이트지비엠 > 1064.8095758723994 #라벨인코더 - 라이트지비엠 > 1069.1629932934077 pred_final = rf.predict(test) submit = pd.DataFrame({'pred':pred_final}) submit.to_csv('result.csv',index=False) pd.read_csv('result.csv')10회 유형2번을 풀어봤는데라벨인코더와 원핫인코딩 두 가지,LightGBM과 랜덤포레스트 두 가지이렇게 써서 4가지 경우의 수로 rmse가 가장 낮은 모델을 사용했습니다.이 정도의 과정만 거쳐서 가장 좋은 모델을 적용해서 제출해도 높은 점수를 받을 수 있을까요? 기출 대부분이 전처리(결측치삭제, 대체 등)과정이 필요없던데 이번에 다가오는 시험에서도 전처리 할것이 없다고 판단되면 굳이 안건드려도 되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
분산분석 질문
안녕하세요 생각보다 할게 많아 복잡해서 몇가지 여쭤보고자 합니다!! 일원 분산 분석을 진행 할때 가장 먼저 정규성 검정을 해서 A,B,C,D라는 그룹이 있다는 가정하에 하나라도 0.05를 넘지 못하면 크루스칼 비모수 검정만 진행하고 끝내면 될까요?이원 분산 분석은 정규성 검정, 등분산 검정은 너무 어려워보여서 학습을 안할까하는데 여태껏 출제된적이 있을까요?일원 분산 분석과 이원분산분석의 사후검정 또한 학습을 하는 편이 좋을까요? (양이 너무 많아서 뺄수있으면 빼고싶은 마음에 여쭤봅니다)일원분산 분석에서 만약 등분산검정을 했는데 피밸류가 0.05를 못넘었다면 equal_var=False 이값을 어디에 넣어주어야하나요? 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 작업형2
import pandas as pd train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/8_2/churn_train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/8_2/churn_test.csv") df=pd.concat([train,test],axis=0) df=pd.get_dummies(df) train=df.iloc[:len(train)].copy() test=df.iloc[len(train):].copy() target=train.pop('TotalCharges') from sklearn.model_selection import train_test_split X_tr,X_val,y_tr,y_val=train_test_split(train,target,test_size=0.2,random_state=0) from sklearn.ensemble import RandomForestRegressor rf=RandomForestRegressor(random_state=0) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) pred=rf.predict(test)unique수가 달라서 concat으로 실행했는데 오류가 납니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 제출
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형 2번 제출 시 result.to_csv("result.csv", index = False) 까지만 적어서 제출하면 되나요? 아니면 pd.read_csv("result.csv") 까지 작성해서 제출해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 할때
원핫인코딩 시 train, test 데이터를 pd.concat 로 병합하고 다시 분리하는 단계는 생략해도 되나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
melt함수질문
import pandas as pd를 불러온 상태라면pd.melt(df) 와 df.melt() 둘중에 골라서 써도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이트타임
자료엔 오류가 안났긴했는데 17 Feb 2024 이런 데이터가to_datetime 함수를 썼는데 만일 오류가 난다면이때 format에 어떻게 작성해야할까요? Feb << 이걸 어떻게 써야할지모르겠습니다
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
레이블 인코딩 질문 있습니다
처음에 set()함수 결과가 '주구매상품'에서만 고유값이 다르다고 결과가 나왔는데 라벨 인코딩에서는 왜 주구매 지점까지 같이 인코딩하나요?주구매상품만 인코딩하면 안되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
공부의 방향성에 대해 문의합니다.
안녕하세요. 다음주 빅데이터실기 준비중인 직장인입니다. (5*대)[현재상태]온라인강의는 1~114번까지 1회 정독 및 가능한 같이 코딩해봄( 모르는것이 있으면 풀이과정을 보며 방향성을 잡고 풀어봄, 60~70%정도는 풀이과정의 도움을 받음 )작업형2~3형은 대충 시험의 방향성을 잡히는것 같고, 작업형1형은 더 많이 풀어 보는수 밖에 없는것 같음[오늘 이후 공부의 방향성에 대한 질의]오늘 이후 8~8일 정도 어떤 계획을 가지고 공부를 진행해야 하는지요?시험시간 3시간에 대한 감이 없는데, 어떻게 풀어야 하는지는 생각이 나는데 함수 및 명령어 등이 생각이 않나는 경우 dir 및 help 기능을 참조하면 풀수 있는 시간인지요 3시간이?꼭 암기해야하는 부분은 무엇인지요?5*대이니 해도해도 자꾸만 단어등이 깜박깜박하네요.강사님의 좋은 조언 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의고사 오류
어제까지 모의고사를 잘 풀고 있었으나,오늘 새벽부터 갑자기 이러한 오류가 발생하고 있습니다. 원인과 해결법을 알 수 있을까요?
-
해결됨<머신러닝, 핵심만 빠르게!> 완독 챌린지
온라인 강의 관련 문의
안녕하세요.온라인 강의를 듣기 위해서 별도로 쿠폰을 등록해야하는지 몰랐습니다.기한이 만료되어 현재 받을 수 없다고 알림이 뜹니다.혹시 다시 받을 수 있을까요? ㅠㅠ메일은 dong2857210@gmail.com입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실제 문제에서 평가지표를 다 외워야할까요?
평가 지표 외우기가 힘든데 R-Squared만 외워도 합격하는데 문제가 없을까요?학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1모의문제2문제4
여기서 .columns를 안 붙여도 삭제가 되는데 붙이는 이유가 있을까요? 안 붙여도 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
9회 기출 작업형3 문제 1-3
강의시간 16:46 따로 test["design"]에 안넣고 변수로 지정하여서 예측을 진행한 후 rmse계산을 하였는데 결과가 다르게 나온 이유가 무엇일까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
앞서서 잘못저장된거 어떻게 취소하나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요df['출동시간'] = pd.to_datetime(df['출동시간']) df['도착시간'] = pd.to_datetime(df['도착시간']) df.info() 이렇게 했어야했는데 실수로 df['출동시간'] = pd.to_datetime(df['출동시간']) df['도착'] = pd.to_datetime(df['도착시간']) df.info() 이라고해서 0 소방서 100 non-null object 1 출동시간 100 non-null datetime64[ns] 2 도착시간 100 non-null datetime64[ns] 3 도착 100 non-null datetime64[ns] 이라고 나옵니다 실수로 도착이라고 저장된거를 어떻게 취소하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 답안 제출 시 질문입니다.
지금 기출 6회 작업형 1-1번 문제를 풀던 중 갑자기 의문이 생겼습니다. result = df.gruopby('소방서')['diff'].mean()에서 나온 결과물에서 바로 수치를 확인하고 답안을 제출해도 되는지?? 꼭 print(81)로 코드가 입력하여 결과물이 나온 상태로 확인하고 답안을 제출 해야하나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 문제2
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 저는 파이썬 왕초보인점 먼저 밝힙니다 ㅜ df.loc[2000].mean() 을 실행했을 때 왜 저는 선생님처럼 안나오고 np.float64(100.735) 이렇게 나올까요? 똑같은 코드를 썻는데요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제1번 '상위' 오해 소지는 없을까요?
문제 1번에서 상위 10개 데이터라고 하는데, 언젠가 풀어본 문제에서 "상위 10개"가 값이 큰 순서대로 상위 10개가 아니라, 그냥 주어진 데이터에서 상위 10개를 뽑는 경우가 있었어서 처음에 풀 때 그냥 주어진 값에서 index 0~9까지를 추출했습니다. 근데 풀이내용을 보니, 내림 차순 후 진행하시더라구요...혹시 실제 문제에서 이런 오해의 소지가 있을만한 건 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
필수 인강 리스트
안녕하세요. 현재 커리큘럼에따라 2과목까지는 다 들었는데 시험일정이 촉박하여 모든 인강을 듣고, 실습 연습까지 할 수 는 없을거 같은데필수 인강 리스트와 필수 문제리스트를 추천해주실 수 있으실까요?데이터분석을 대학교때 어느정도해서 기초는 있는 상황입니다.