묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3 꼬리질문2번
두 집단의 로그 리지스틴 값에 대한 합동 분산 추정량을 구하기 위에서 아래의 코드로 푸는 풀이가 알맞는지 질문드립니다.(혹은 우연의 일치로 해당 값이 나온건지 궁금합니다.) 꼬리질문 2에서 두 집단이라고 출제되었기에 df를 나누지않고, 로그 리지스틴 값이라고 명시되어 로그 리지스틴을 기준으로 구하는 것이기에 리지스틴에 로그를 취한 것을 종속변수로 설정해 풀었습니다. import pandas as pd import numpy as np df = pd.read_csv("data/bcc.csv") # 사용자 코딩 from statsmodels.formula.api import ols from statsmodels.stats.anova import anova_lm model = ols('np.log(Resistin) ~ C(Classification)', data=df).fit() print(anova_lm(model))출력 결과 (분산은 잔차들의 제곱의 평균이니까)이렇게 출력된 결과 Residual(잔차)의 mean_sq의 값을 두 집단의 로그 리지스틴 값에 대한 분산이라고 생각해도 되는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 개수를 구할 때, len과 value_counts 차이
20강작업형1 - 연습문제 8번5분 55초 데이터 개수를 구할 때 len 대신 value_counts를 사용할 수는 없는건가요?
-
해결됨베개투자법 완성: 아침이 설레는 AI 주식 완전 자동매매 Claude 바이브코딩
API 오류: EGW00201 - 초당 거래건수를 초과
거래 로그를 보는데 계속 이런게 뜨네요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 제출방
안녕하세요~작업형 2 분류와 회귀 강의를 학습하는 도중 질문이 있습니다!분류에서는제출 파일은 예측값만 result.csv 파일로 생성해 제출(컬럼명: pred, 1개) 회귀에서는제출 파일은 예측값만 포함된 result.csv로 생성 (컬럼명: pred, 1개) 분류 강의에서는 생성해 제출이라고 하셨고, 회귀 강의에서는 생성이라고 하셨는데 분류와 회귀 강의에서 한 작업에서 다른 점이 없는 거 같아서 질문드립니다. (데이터프레임 만들어서 제출하되 read로 행 개수 확인하기)정확히 어떤 차이가 있는 걸까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 스케일링 순서
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요인코딩과 스케일링 순서가 궁금합니다.인코딩 하고 스케일링 하면 문자형들이 이미 숫자로 바껴서 스케일링 먼저 하고 인코딩이 낫나요?라벨 인코딩 하면 0~1보다 더 큰 숫자여서 라벨 인코딩 한 것 자체도 스케일링 될 거 같은데 괜찮은지 모르겠습니다.
-
해결됨베개투자법 완성: 아침이 설레는 AI 주식 완전 자동매매 Claude 바이브코딩
캐글 save version 할 시 md파일과 다름.
수업 자료와 캐글 창이 현재 다릅니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실제 시험에서도 공식을 문제에서 주는지
실제 시험에서는 3번째 줄까지만 문제로 주어지는걸까요?아니면 해당 문제와 같이 min_max 스케일링의 공식도 같이 주어지는 건가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
안녕하세요 6.8까지 강의를 수강 했던 수강생입니다.6.9 부로 기간이 만료됐는데 다시 결제를 하자니 부담이 되는상황이라혹시 6.20 시험 전까지라도 단기기간 결제를 하여 연장이 가능할까요?인프런 고객문의를 통해서 오늘 하루 연장하여 이렇게나마 문의를 드립니다.이메일 woog2866@naver.com 입니다!
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ
###데이터전처리(범주형 데이터 수 많은데 카테고리 다를 때 삭제, 비행기 문제 생각)train = train.drop(‘컬럼명’, axis=1)test = test.drop(‘컬럼명’, axis=1)결측치 채우기 (범주형)cond_o = ['범주형컬럼명1',‘컬럼명2’...]train[cond_o]=train[cond_o].fillna("X")test[cond_o]=test[cond_o].fillna("X")결측치 채우기 (수치형, 0/중앙값/최소값/평균 등 데이터에 맞게)cond_f = ['컬럼명1‘,’컬럼명2'...]train[cond_f]=train[cond_f].fillna(0)test[cond_f]=test[cond_f].fillna(0)target = train.pop(‘타겟컬럼명’) ###인코딩print(train.shape, test.shape)train = pd.get_dummies(train)test = pd.get_dummies(test)print(train.shape, test.shape) (범주형 카테고리 다르면 합쳐서 원핫인코딩 진행)print(train.shape, test.shape)concat = pd.concat([train,test])concat_dummies = pd.get_dummies(concat)n_train = len(train)train = concat_dummies[:n_train]test = concat_dummies[n_train:]print(train.shape, test.shape)###하이퍼파라미터class_weight='balanced' : 타겟 데이터 불균형일 때 사용max_depth : 3~7(분류) 7~12(회귀)n_estimators : 200~600 (100단위)learning_rate : n_estimators 와 반비례하게 사용 - 0.01~0.1 (랜덤포레스트에서 적용 안됨)이렇게 정리해서 외워도 될까요??하이퍼파라미터는 각각 어떤 상황에 사용해야 하는지 잘 모르겠습니다ㅠㅠ
-
미해결RAG 마스터: 기초부터 고급기법까지 (feat. LangChain)
dotenv, langchain_community 로드가 되지 않습니다.
안녕하세요. 영상잘보고 있습니다.하나하나 따라해보고 있는 중,dotenv, langchain_community 두 모듈의 실행이 되지않아 문의글 남깁니다.( requirements 에 langchain_community 는 확인했으나, dotenv는 보이지 않네요) 아나콘다환경에서 VSCode를 실행했습니다.혹시 다른 첨부파일에 있는 걸까요? pdf_files, 데이터, 실습파일 에는 없는 것으로 확인했습니다.확인해주시면 감사드리겠습니다.
-
해결됨원클릭으로 AI가 생성해주는 Youtube 쇼츠 만들기 자동화(with n8n)
Basic LLM Chain 에서 Paser 를 사용해 JASON 형식으로 바꾸는 부분에서 에러가 발생합니다
Basic LLM Chain 에서 Paser 를 사용해 JASON 형식으로 바꾸는 부분에서 에러가 발생합니다. 특히, 강의 중에 나오는 Use API Response 를 껐는데도 안 됩니다
-
해결됨베개 리서치: 종목 입력만으로 애널리스트급 리포트 만들기
FMP API 유료
아래 내용을 참조하여 질문을 작성하시면 보다 빠르고 정확한 문제 해결을 지원받을 수 있습니다. 정확한 강의명베개 리서치: 종목 입력만으로 애널리스트급 리포트 만들기 타임라인 구체적인 질문사항FMP API가 강의 코드에 사용되는 기능이 유료화가 된 것 같은데 추천하실 만한 대체재가 있을까요?에러가 발생하는 경우 로그도 첨부 부탁드립니다.
-
해결됨[Level 1] Qt를 이용한 Python 프로그래밍: 입문편
강의가 넘 좋아서 3번째 복습을 하고 있는데
안녕하세요강의가 넘 좋아서 3번째 복습을 하고 있는데3과목이기간이 1달 밖에 안남아서요불쌍히 여기시어 3개과목 3달씩 연장 가능할가요?ㅎㅎ감사합니다[Level 1] Qt를 이용한 Python 프로그래밍: 입문편[Level 2] Qt를 이용한 Python 프로그래밍: QML편[Level 3] 초보를 넘어 전문가로: Qt와 Python을 통한 실전 응용 마스터 클래스
-
해결됨알고리즘 트레이딩의 비밀, AI가 주가를 맞추는 법
예측에 사용하는 경제지표의 활용에 대해
안녕하세요. 좋은 강의 감사합니다.예측의 요인들을 넣고 빼는 과정에서 궁금한게 있어 질문드립니다. 강의 예시에서 QQQ 혹은 S&P 500 ETF 등의 인덱스 연동 ETF를 주로 예로 사용하였습니다.이 때, 동일한 경제지표를 제외하는 예시를 보여주셨는데, 실제 QQQ의 경우는 나스닥 100을 추종하고 있으며 S&P 500(SPY)의 경우에는 S&P 500 지수를 추종하고 있습니다.그렇다면, 해당 두 ETF를 제거하는 것 이외에 동일한 추종 지수도 제외해야 예측에서의 유효성이 더 높은 것 아닐까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
14강 "" 사용 관련 질문
14강 18분 37초 수강중입니다.# 하나의 열에 대해 여러 집계 함수를 동시에 적용 pt = df.pivot_table( index=['구분', '크기'], values=['수량', '금액'], aggfunc={'수량': "mean", '금액': ["min", "max", "mean"]} ) pt이 부분에서,"min", "max", "mean" 같은 내장함수를 왜 "" 안에 넣어야 하는지 궁금합니다.
-
해결됨알고리즘 트레이딩의 비밀, AI가 주가를 맞추는 법
강의 자료를 어디서 확인 할 수 있나요?
강의 자료를 확인할 수 있는 노션 링크를 알려주십시오있었는데 갑자기 안 보여서 그렇습니다
-
해결됨베개투자법 완성: 아침이 설레는 AI 주식 완전 자동매매 Claude 바이브코딩
FRED API
FRED API가 소스코드에 그대로 들어가 있는 것 같은데 괜찮은가요? 강의 듣다보니까 왜 FRED만 stock.py에 들어가있는지 궁금해서 찾다가 도저히 발급 받은 기억이 없어서 여쭤봅니다. 그리고, FRED keye도 env로 옮겨도 상관없죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 제출 점수
코랩에서 lightgbm으로 학습시키고 f1-score 출력했을 때는 0.5277이 나왔는데 캐글에 제출하니까 0.3028으로 더 낮게 나오는데 왜 이런 건가요??
-
해결됨(AI 퀀트) 코드 한 줄 안 쓰고 주식 자동 분석 시스템 만들기 feat. Claude CLI
VCP 시그널 상태 추가 스크립트 에서 return_pct 조건
return_pct > 0 이면 status="CLOSED", 아니면 status="OPEN" 이런 조건이면 1원만 올라도 익절 아닌가요?
-
해결됨(AI 퀀트) 코드 한 줄 안 쓰고 주식 자동 분석 시스템 만들기 feat. Claude CLI
캐쉬가 업데이트 안됩니다.
PriceCache는 한 번 채우면 무한정 유지됩니다. 그리고 캐시를 주기적으로 갱신하는 주체가 없습니다. 그래서 한 번 들어간 값은 bulk_update를 다시 불러주기 전까지 영원히 고정됩니다.