묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
city 컬럼 삭제
cols = train.select_dtypes(include='O').columns for col in cols: train_set = set(train[col]) test_set = set(test[col]) same = (set(train[col]) == set(test[col])) if same: print(col, "동일") else: print(col, "동일하지않음")이 코드를 실행했을 때 'city'가 동일하지 않다고 나와서 city컬럼을 train과 test 모두에서 삭제해야하는 줄 알았는데 보통 어느 경우에 컬럼을 삭제하는 건지 궁금합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 기출(작업형 2) 질문 있습니다!!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 이 문제에서 궁금한점이있는데 여기서는 수치형, 범주형 나눠서 처리를 해주는데 다같이get_dummies 해주면 안되는 문제인건가요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 탬플릿에 대한 질문입니다
강의를 들으면서 여러 문제를 풀고 또 만들어서 해결하는 중인데2유형 같은 경우에는 기본적인 탬플릿이 유지한 상태에서 문제에 따라서 조금만 변형하면 되는걸로 알고 있는데 제가 사용하는 탬플릿이 문제가 있을까요?# gas_train.csv, gas_test.csv를 이용하시오. # 학습 데이터의 총가스사용량을 종속변수로 사용하여 # 테스트 데이터의 총가스사용량을 예측하시오. # 조건은 다음과 같다. # 1. 문자형 변수는 원-핫 인코딩하시오. # 2. 학습 데이터와 테스트 데이터는 동일한 방식으로 전처리하시오. # 3. 모델은 RandomForestRegressor를 사용하시오. # 4. 검증 데이터 비율은 20%로 하시오. # 5. RMSE를 출력하시오. # 6. 테스트 데이터 예측 결과를 result.csv로 저장하시오. # 7. 제출 파일은 pred 컬럼만 포함하시오. # 세팅 import pandas as pd import numpy as np from sklearn.ensemble import RandomForestRegressor from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error # 데이터 불러오기 train = pd.read_csv('gas_train.csv') test = pd.read_csv('gas_test.csv') # target 지정 target = '총가스사용량' # X, y 분리 y = train[target] X = train.drop(target, axis=1) # id 컬럼 제거 if 'id' in X.columns: X = X.drop('id', axis=1) if 'id' in test.columns: test_X = test.drop('id', axis=1) else: test_X = test.copy() # train / test 합치기 data = pd.concat([X, test_X], axis=0) # 원 핫 인코딩 data = pd.get_dummies(data) # train / test 분리 X = data.iloc[:len(X), :] X_test = data.iloc[len(X):, :] # 학습용 / 검증용 데이터 분리 X_tr, X_val, y_tr, y_val = train_test_split( X, y, test_size = 0.2, random_state = 42) # 랜덤포레스트 model = RandomForestRegressor(random_state = 42) model.fit(X_tr, y_tr) # 검증 데이터 예측 val_pred = model.predict(X_val) # rmse 계산 mse = mean_squared_error(y_val, val_pred) rmse = np.sqrt(mse) print('RMSE:', rmse) # 다시 학습 model.fit(X, y) # 테스트 데이터 예측 pred = model.predict(X_test) # 파일 생성 result = pd.DataFrame({'pred':pred}) result.to_csv('result.csv', index = False)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 질문 드립니다.
안녕하세요!시험장에서 import pandas as pddf = pd.read_csv("~") 각 유형별로 문제를 불러오는 코드는 기본적으로 제공이 되는걸까요? 감사합니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강기간 연장 가능 여부 문의드립니다
안녕하세요.현재 해당 강의를 수강 중인 수강생입니다.제 수강기간이 6월 5일까지인데, 6월 20일 실기시험을 앞두고 있어 시험 전까지 조금 더 복습이 필요한 상황입니다.기존 Q&A 문의 글을 확인해보니, 저와 비슷하게 시험일까지 짧은 기간이 남은 경우 추가결제 등의 별도 방안이 있는 것 같아 조심스럽게 문의드립니다.혹시 시험일까지 남은 짧은 기간 동안 추가 결제를 통해 수강할 수 있는 방법이 있을지 확인 부탁드립니다.메일 주소를 다들 남기시길래 저도 남겨봅니다.메일주소: ehehehe810209@naver.com 감사합니다.
-
해결됨(AI 퀀트) 바이브 코딩으로 미국 주식 AI 자동 분석 시스템 만들기 with Claude Code
Visual Studio Code 대신 Pycharm 써도 되나요?
예전에 Pycharm 통해서 Python을 사용해서 그러는데, Pycharm해도 되는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제2-2에서 유의한 변수에서 음수는 유의한지?
문제2-2에서 유의한 변수는 0.05보다 큰수를 의미하는 걸로 알고 있는데, height의 회귀변수(coef)는 음수인데 0.05보다 큰걸로 봐야 하는지요?
-
미해결파이썬 알고리즘 트레이딩 파트1: 알고리즘 트레이딩을 위한 파이썬 데이터 분석
본 강의와는 상관없는 내용입니다만..
본 강의의 뒤에 이어지는 강의는 IBKR의 API를 이용하여 알고리즘 매매를 구현하는 걸로 알고있습니다. IBKR의 API를 이용하려면 IBKR로 송금을 해야 하는데 이 경우 외국환 거래법 위반이 되는건 아닌지요? 혹시 IBKR에서 모의계좌를 개설하는지? 모의계좌로 하더라도 구축한 알고리즘을 사용해서 실제 자금을 운영하려면 IBKR 계좌로 송금이 필요한데 이 부분은 문제가 없는지? 질문 드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 만료 후 오프라인 저장 강의 수강 가능 여부
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요오늘 5월 30일 9시 50분 강의 수강 만료 됩니다.다름이 아니라 현재 디스코드 챌린지 진행중인데, 혹시 수강 연장이 가능하거나 아니면 오프라인 저장하면 만료이후에도 수강 가능한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
xgboost에 관해
작업형2에서는 보통 랜덤포레스트로 전부 커버 되는것으로 알고있습니다.모든 문제를 xgboost말고 랜덤포레스트로 사용하여 max_depth, n_estimators를 통해 값을 조절하여 푸는 방법으로 진행해도 별로 문제가 되지 않을까요?
-
해결됨(AI 퀀트) 바이브 코딩으로 미국 주식 AI 자동 분석 시스템 만들기 with Claude Code
antigravity로 하던 작업 이제 visual code로 하면 되는 거죠?
??
-
해결됨(AI 퀀트) 바이브 코딩으로 미국 주식 AI 자동 분석 시스템 만들기 with Claude Code
다음 강의 얼른 올려주세요
얼른
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
평가지표 RMSE 문의
안녕하세요~ 평가지표 16:15 이후 나오는 RMSE는 ‘24년도 현재 함수 사용이 가능해진 것으로 알고 있는데, RMSE 평가지표 사용 시 함수를 별도 이용하지 않고, mse ** 0.5라는 수식을 기억해서 사용해야하는지 문의드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
1-3번문제 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요15분 부근 내용입니다!1-3번 풀때 model.predict 안에 test를 그대로 넣어서 예측하고있는데, 그러면 정답 컬럼을 가지고 예측하는건가요? 작업형2처럼 분리를 안하고 정답을 그대로 넣으면 되는건지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀모델 평가지표 최근 시험환경에서의 지원여부가 궁금합니다
작업형2 모의문제2 강의에서 이 세가지는 제공하지 않고 있다고 말씀하셨는데 또 이전 강의에서는 RMSE도 지원한다고 설명하셨어서 뭐가 맞는건지 궁금합니다 ㅜㅜ코랩에서는 되는 것 같은데 시험환경에서도 6가지 평가지표 모두 지원되는거 맞나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
컬럼 삭제 관련
밑에 q&a를 보면서 학습에 굳이 필요없는 값들은 삭제해야되는 것이 인코딩하기에 유리하다는 것을 이해했습니다.다만 실제 시험에서는 어떤 컬럼을 삭제해야할지 확실하지 않을 경우 그냥 컬럼 삭제 없이 인코딩을 진행해도 무방한지 알고싶습니다.그동안의 기출에서도 굳이 삭제하지 않고 인코딩 했을때에 불이익이 없었는지도 궁금합니다.cols = ['name', 'host_name', 'last_review', 'host_id'] print(train.shape) train = train.drop(cols, axis=1) test = test.drop(cols, axis=1) print(train.shape)먼저 유사한 질문이 있었는지 검색해보세요
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
레이블 인코딩과 원핫 인코딩
원핫 인코딩 : 순서가 없는 컬럼레이블 인코딩 : 순서가 있는 컬럼이렇게 공식화 해도 되는걸까요? 예를 들면여자, 남자와 같은 컬럼이 있을 때는 원핫 인코딩low, mid, high 같은 컬럼이 있을 때는 레이블 인코딩 아님 상황에 따라 각각 구별해야하는 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검정결과 질문(채택/기각)
[작업형3] 4~5분산분석 문제 중 일원분산분석 문제에 3번 내용이 왜 기각인지 잘 모르겠어요 .. p-value값이 0.05보다 크게 나오는데 왜 기각일까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마인드맵에서 암기해야할 내용은 별마크 인가요
별마크만 암기해야하는것인지 모두 암기해야하는것인지 궁금합니다.현재 판다스 이론강의까지 들었는데 특별히 어려운 부분이나 암기할것은 없어보여 다행이라 생각했지만작업형1,2,3 마인드 맵을 보니 내용이 상당히 많은거 같아 우려가 됩니다.문의 내용마인드맵에서 암기해야할 내용은 별마크만 해도 되는지모두 암기해야 하는지 가능한 효율적으로 시간을 쓰고자 미리 말씀해주시면 마인드 맵을 인쇄해놓고미리미리 암기를 하고자 합니다.넉넉한 합격70점이상을 위해서 별마크만 암기해야하는지 전체다 명령어를 알아야 할지문의드리고자 합니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의드립니다
안녕하세요 강사님 ! 실기 강의를 들으면서 정말 많은 도움을 받았습니다. 감사합니다. 실기를 다시 한번 쳐야 되는데 수강 마감이 6월초이고, 시험 날짜는 6월20일이라 수강 기한을 조금만 늘었으면 하는 제 간절한 바램입니다 ㅠㅠ 이번이 마지막이다 생각하고 열심히 수강 할 계획이라 혹시 기한을 이번 시험 때까지만 연장이 가능할지 문의 드립니다.메일 주소jcw7488@naver.com