묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
독립표본검정
이론 관련 내용입니다. 독립표본검정 영상에서 1':34'' 위치에from spicy import statsstats.ttest_ind(A,B) 이 부분을 설명해 주실때 A와 B에 (처리집단, 대조집단)이라고 설명해주시는데요!어떠한 작업을 처리했다면 처리한 집단을 A에 넣고 그것과 비교할 아무것도 처리하지 않은 집단을 B에 넣는다는 설명은 이해했습니다.그런데, 그렇다면 대응표본검정과는 어떻게 다른걸까요? 사전/사후 검정과 비슷한 개념 아닌가요?? 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요문제를 풀다 보면 mean을 쓸 때와 transform('mean') 을 써야하는 상황이 생길텐데 문제에 어떤 부분에서 그런 힌트를 얻을 수 있을까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.describe() 사용을 자제해야할까요?
현재 작업형1 문제를 풀고 있는 수강생입니다.문제 풀이 방식에 궁금함이 있어 저의 풀이 방식을 연습하면서 고쳐나가야하는지 알고싶어 문의 드립니다. 저는 문제 풀 때 df.describe()으로 평균이나 사분위수를 눈으로 보고 해당 값을 직접 작성해서 문제를 풀거나, df.value_counts()로 최빈값을 눈으로 확인해서 푸는 방식으로 문제를 풀고있습니다.이러한 풀이 방식을 강의 내용처럼 아래와 같은 코드로 푸는 방식으로 개선하면서 공부해나가야하는지 의문이 들어 질문드립니다.df['views'].quantile(.75) freq = df['f3'].mode()[0]예를 들어 Section13번 문제를 이렇게 풀이하는 방식으로 해도 되는지 궁금합니다.cond = df['f1'].isnull() df = df[cond] df['age'].describe(include = 0) print(round(53.596774,1))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
shape 결과에 대한 문의
작업형2 마지막에 제출하기 위해서 shape로 형태를 확인하자나요. 강사님 결과는 (903,) 이렇게 뜨는데 저는 (903,1) 이라고 뜹니다. 제가 뭔가 잘못친걸까요. 이렇게 제출되면 0점 처리인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
자료 문의
안녕하세요?주피터 노트북을 강의때마다 일일이 불러와야하나요? 전체 강의 실습에 활용하는 주피터 노트북을 한 번에 받아올 수 있는 통합된 링크는 없는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8 회귀 11번
from statsmodels.formula.api import ols model = ols('주문량 ~ 광고비', data=df).fit() model.summary() 11번에 위와 같은 코드를 작성해서 0.05보다 작아서 기각이라고 판단해도 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
심화 강의 관련 질문
15강, 16강처럼 [심화] 강의를 안 들으면 시험 합격에 많이 영향을 미치는지 궁금합니다.시험일까지 시간이 별로 안 남아서요ㅜㅜ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빈도수 구하는 것 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요. 빈도수 구할 때 value_counts()로 구하신 것 확인했습니다.하지만 배울때 df.mode()[0]로도 구할 수 있는 것으로 알고있는데 무방할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
커리큘럼을 따로 인쇄할 수 있는 방법이 있을까요?
안녕하세요. 커리큘럼을 따로 인쇄해서 회사에 제출을 하려고 합니다. 혹시 커리큘럼 자료를 따로 올려놓으신 곳이 있을까요? 그리고 인프런 사업자 등록증도 받고 싶습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 머신러닝 문제풀이 중 test 데이터 에러 문의
안녕하세요 '작업형2 문제제공된 데이터는 성인 인구조사 소득 데이터이다. 제공된 학습용 데이터(train.csv)를 이용하여 소득을 예측하는 모델을 개발하고, 개발한 모델에 기반하여 평가용 데이터(test.csv)에 적용하여 얻은 소득 예측 결과를 아래 [제출 형식] 에 따라 CSV 파일로 생성하는 코드를 제출하시오.' 문제를 강의들으며 열심히 손으로 쓰고 실행하던 중이상처 처리 중 아래의 코드 실행하니cond = test['age']<=0 test[cond] 처음에 test.describe()에서 없던 age에서 마이너스값이 나옵니다. 그래서 하나하나 어디서 문제인가 다시 실행을 해보니 (한 코드 실행마다 test.describe() 실행해보며 체크) 결측치 채우기 중 갑자기 test 데이터에서 마이너스가 뜹니다..왜 그런걸까요ㅠ 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강연장가능문의
안녕하세요.현재 강의를 수강 중인 수강생입니다.제 수강기간이 6월 7일까지로, 6월 20일 에 실기시험을 앞두고 있어 시험 전까지 수강이 가능할지 여쭤보고싶어 질문 남겨놓습니다Q&A 문의 글을 확인해보니, 저와 비슷하게 시험일까지 짧은 기간이 남은 경우 추가결제 등의 별도 방안이 있는 것 같아 문의드립니다.혹시 시험일까지 남은 짧은 기간 동안 추가 결제를 통해 수강할 수 있는 방법이 있을지 확인부탁드립니다퇴근후 딴짓 강의 듣고 꼭 합격하겠습니다!감사합니다메일주소: jyyp3395@gmail.com
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
59. 11회 기출 유형 작업형 1 - 문제2 관련
결측치를 대체한 후 해당 컬럼의 평균을 소수점 셋째 자리까지 구하시오라는 문제에 대하여 df[col].mean()을 실행하면 np.float64(25.055) 출력 2. round(df[col].mean(),3)을 실행하면 np.float64(24.794) 출력print(round(df[col].mean(),3))을 실행하면 25.022라는 값이 나오는데값이 계속 다르게 나오는 이유를 알고 싶습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩 슬라이싱 결과
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요10:12 에 결과값이 아래와 같은데,(29301, 15) (3257, 15)(29301, 107) (29301, 107) 실제로 실행을 시켜보면 107에서 108로 숫자가 늘어났습니다.(29301, 15) (3257, 15)(29301, 108) (29301, 108)코랩에 있는 제미나이에게 물어보니 "만약 test 데이터셋에 train 데이터셋에는 없는 새로운 범주가 하나라도 있다면, data_oh는 그 새로운 범주에 대한 더미 컬럼이 추가로 생기게 됩니다. 따라서 train_oh보다 data_oh의 컬럼 수가 많아질 수 있습니다."라고 나오는데 왜 저는 결과값이 다른걸까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
random_state 값이 궁금합니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요train_test_split 할때 random_state를 보통 0으로 설정하시는데 이 값을 42를 써도되나요??[작업형2]연습문제 섹션 6에 0으로 두는거랑 42로 두는거랑 r2 값이 0.2 차이나서 궁금합니다!!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간 연장 가능 여부 문의드립니다
안녕하세요.현재 해당 강의를 수강 중인 수강생입니다.제 수강기간이 6월 11일까지인데, 6월 20일 에 실기시험을 앞두고 있어 시험 전까지 퇴근후 빡세게 공부해서 이번에는 취득하려고 합니다.Q&A 문의 글을 확인해보니, 저와 비슷하게 시험일까지 짧은 기간이 남은 경우 추가결제 등의 별도 방안이 있는 것 같아 문의드립니다.혹시 시험일까지 남은 짧은 기간 동안 추가 결제를 통해 수강할 수 있는 방법이 있을지 확인 부탁드립니다.메일주소: tmdvy9538@gmail.com 항상 좋은 강의 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
city 컬럼 삭제
cols = train.select_dtypes(include='O').columns for col in cols: train_set = set(train[col]) test_set = set(test[col]) same = (set(train[col]) == set(test[col])) if same: print(col, "동일") else: print(col, "동일하지않음")이 코드를 실행했을 때 'city'가 동일하지 않다고 나와서 city컬럼을 train과 test 모두에서 삭제해야하는 줄 알았는데 보통 어느 경우에 컬럼을 삭제하는 건지 궁금합니다.
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
빅카인즈 open ai 서비스 유료로 전환됐어요ㅠㅠ
실습해보기가 어렵네요 ㅠㅠ
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 기출(작업형 2) 질문 있습니다!!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 이 문제에서 궁금한점이있는데 여기서는 수치형, 범주형 나눠서 처리를 해주는데 다같이get_dummies 해주면 안되는 문제인건가요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 탬플릿에 대한 질문입니다
강의를 들으면서 여러 문제를 풀고 또 만들어서 해결하는 중인데2유형 같은 경우에는 기본적인 탬플릿이 유지한 상태에서 문제에 따라서 조금만 변형하면 되는걸로 알고 있는데 제가 사용하는 탬플릿이 문제가 있을까요?# gas_train.csv, gas_test.csv를 이용하시오. # 학습 데이터의 총가스사용량을 종속변수로 사용하여 # 테스트 데이터의 총가스사용량을 예측하시오. # 조건은 다음과 같다. # 1. 문자형 변수는 원-핫 인코딩하시오. # 2. 학습 데이터와 테스트 데이터는 동일한 방식으로 전처리하시오. # 3. 모델은 RandomForestRegressor를 사용하시오. # 4. 검증 데이터 비율은 20%로 하시오. # 5. RMSE를 출력하시오. # 6. 테스트 데이터 예측 결과를 result.csv로 저장하시오. # 7. 제출 파일은 pred 컬럼만 포함하시오. # 세팅 import pandas as pd import numpy as np from sklearn.ensemble import RandomForestRegressor from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error # 데이터 불러오기 train = pd.read_csv('gas_train.csv') test = pd.read_csv('gas_test.csv') # target 지정 target = '총가스사용량' # X, y 분리 y = train[target] X = train.drop(target, axis=1) # id 컬럼 제거 if 'id' in X.columns: X = X.drop('id', axis=1) if 'id' in test.columns: test_X = test.drop('id', axis=1) else: test_X = test.copy() # train / test 합치기 data = pd.concat([X, test_X], axis=0) # 원 핫 인코딩 data = pd.get_dummies(data) # train / test 분리 X = data.iloc[:len(X), :] X_test = data.iloc[len(X):, :] # 학습용 / 검증용 데이터 분리 X_tr, X_val, y_tr, y_val = train_test_split( X, y, test_size = 0.2, random_state = 42) # 랜덤포레스트 model = RandomForestRegressor(random_state = 42) model.fit(X_tr, y_tr) # 검증 데이터 예측 val_pred = model.predict(X_val) # rmse 계산 mse = mean_squared_error(y_val, val_pred) rmse = np.sqrt(mse) print('RMSE:', rmse) # 다시 학습 model.fit(X, y) # 테스트 데이터 예측 pred = model.predict(X_test) # 파일 생성 result = pd.DataFrame({'pred':pred}) result.to_csv('result.csv', index = False)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 질문 드립니다.
안녕하세요!시험장에서 import pandas as pddf = pd.read_csv("~") 각 유형별로 문제를 불러오는 코드는 기본적으로 제공이 되는걸까요? 감사합니다.