묻고 답해요
169만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결칼만 필터: 예제로 이해하는 상태추정의 수학적 원리
8분54초 테이블 내용 문의
제가 통계를 본지 오래되어 해깔리는데, 8분54초의 테이블의 확률이 모두 1/6이라고 되어 있는데, 이거 1/36일 것 같은데, 혹시 왜 1/6인지 알수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
안녕하세요, 코딩팡 장업형2 베이스 라인에서 원-핫 인코딩만 사용하셨는데 인코딩 부분에 아래와 같이 추가해서 레이블 인코딩과 원-핫 인코딩 결과를 비교하는 식으로 해도 상관없나요?원핫 인코딩만 사용하신 이유가 있을까요??1번 문제import pandas as pd # 1) 데이터 불러오기 train = pd.read_csv('data/car_train.csv') test = pd.read_csv('data/car_test.csv') # 2) 범주형 변수 원-핫 인코딩 target = train.pop('target') print(train.shape, test.shape) train = pd.get_dummies(train) test = pd.get_dummies(test) print(train.shape, test.shape) # 레이블 인코딩 from sklearn.preprocessing import LabelEncoder cols = train.select_dtypes(include = 'object').columns for col in cols: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) # 3) 검증용 분리 (제출 전 성능 비교) from sklearn.model_selection import train_test_split X_tr, X_val, y_tr, y_val = train_test_split(train, target, test_size=0.2, random_state=0, stratify=target) # 4) 세 가지 모델 학습 from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr, y_tr) pred = rf.predict(X_val) from sklearn.metrics import f1_score print(f1_score(y_val, pred, average='macro')) from lightgbm import LGBMClassifier lgb = LGBMClassifier(random_state=0, verbose=-1) lgb.fit(X_tr, y_tr) pred = lgb.predict(X_val) print(f1_score(y_val, pred, average='macro')) from xgboost import XGBClassifier xgb = XGBClassifier(random_state=0, verbosity=0) xgb.fit(X_tr, y_tr) pred = xgb.predict(X_val) print(f1_score(y_val, pred, average='macro')) # 5) 선택한 모델을 전체 train으로 다시 학습 후 test 예측 (선택) # lgb.fit(train, target) # pred = lgb.predict(test) # 6) 제출 파일 저장 (pred 컬럼 1개만, index 제거) result = pd.DataFrame({'pred': pred}) result.to_csv('result.csv', index=False) # 제출파일 확인 print("\n ===== 제출파일 (샘플) =====") print(pd.read_csv("result.csv").head()) print("\n ===== 제출파일 (크기 확인) =====") print(pd.read_csv("result.csv").shape)
-
미해결안정적인 AI 에이전트 서비스 운영을 위한 평가(Evaluation) 방법
multi_tool_agent.py 에서 arxiv tool 에러
강사님 uv setting 대로 실습을 진행하는 도중에 아카이브 tool 호출 시 아래의 에러가 발생했습니다.AttributeError: 'Search' object has no attribute 'results'uv add "arxiv<2.4.1" 로 다운그레이드 해서 해결했습니다. 혹시나 동일한 에러가 나시는 분들을 위해 남겨둡니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱회귀, 회귀
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 기출 풀어보면 C를 안 붙이고, object도 자연스럽게 변환된다고 하셨는데, 연습할 때 gender에 C를 붙였던 경험이 있습니다. 혹시 언제 붙이고 언제 안 붙이는지 알 수 있을까욤..?
-
미해결실전! Django 입문 [최신 5.2 버전]
가상 환경과 차이 도커 질문
안녕하세요! 강의 수강 중에 가상 환경과 도커의 차이점이 궁금해서 질문드립니다제가 이해한 게 맞다면 도커를 이용하면 굳이 가상 환경은 이용하지 않아도 될 것 같은데 맞나요?
-
미해결프로그래밍 시작하기 : 파이썬 입문 (Inflearn Original)
자료 다운로드 위치 확인 부탁드립니다.
안녕하세요? 현재 chapter 9 강의 수강중입니다.강의 내용중에 아래 이미지에 있는 resource 와 sound 폴더를 다운로드 받아서 개인 PC local 에 복사를 하는 부분이 있는데, 해당 폴더들은 어디에 있는지 확인 부탁드립니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀 문제를 풀때 질문입니다.
model.summary()로 풀수 있는 문제는 그냥 답만 적어도 상관없나요 따로 print 없이
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
불균형 처리 후 성능이 더 낮아졌다면,
불균형 처리 후 성능이 더 낮아졌다면, 불균형 처리를 제외시킨 후 제출하는 것이 맞죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 체험 제2유형 에러 문의
빅데이터분석기사 실기체험에서 작업형 제2유형을 회귀 실습해보고 있는데. 에러가 나는데 이유를 전혀모르겠어요.import pandas as pdtrain = pd.read_csv("data/customer_train.csv")test = pd.read_csv("data/customer_test.csv")target = train.pop('총구매액')train = pd.get_dummies(train)test = pd.get_dummies(test) from sklearn.ensemble import RandomForestRegressormodel = RandomForestRegressor()model.fit(train, target)p = model.predict(test) submit = pd.DataFrame({'pred':p})submit.to_csv("result.csv", index=False)print(submit.head()) 에러)Makefile:6: recipe for target 'py3_run' failedmake: *** [py3_run] Error 1Traceback (most recent call last):File "/goorm/Main.out", line 38, in <module>p = model.predict(test)^^^^^^^^^^^^^^^^^^^File "/usr/local/lib/python3.12/site-packages/sklearn/ensemble/_forest.py", line 1063, in predictX = self._validate_X_predict(X)^^^^^^^^^^^^^^^^^^^^^^^^^^^File "/usr/local/lib/python3.12/site-packages/sklearn/ensemble/_forest.py", line 641, in validateX_predictX = self._validate_data(^^^^^^^^^^^^^^^^^^^^File "/usr/local/lib/python3.12/site-packages/sklearn/base.py", line 608, in validatedataself._check_feature_names(X, reset=reset)File "/usr/local/lib/python3.12/site-packages/sklearn/base.py", line 535, in checkfeature_namesraise ValueError(message)ValueError: The feature names should match those that were passed during fit.Feature names seen at fit time, yet now missing:- 주구매상품_소형가전
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
문제에서는 0.17 0.33 처럼 제출하라고 되어있는데. LIGHTGBM 으로 예측하면 소수점이 더 길게 나오자나요. 이렇게 제출해도 문제가 없는걸까요? 아니면 반올림처리해서 제출해야하나요.....
-
미해결베개투자법 완성: 아침이 설레는 AI 주식 완전 자동매매 Claude 바이브코딩
안녕하세요
얼마전에 선행이 안돼어있어서 앞전강의 수강하면서 진행하는데 앞전강의는 커서를 유료 수강해야 해서 진행해야하는지요.커서 화면도 다르고 폴더를 불러도 하위메뉴나 뉴폴더 그리고 말씀해주신 파일 불러와도 옆에 창만뜨고 뭐 아무것도안떠서요,, 화면이 다르니 너무어렵고 계속 재설치만하고 진행을 도저히 못하겠네요 대체 어떠한거 유료로 결제하고 해야하는지 ;;ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3번문제 등분산 가정
1번 풀 때 구한 분산을 보면, 두 집단의 분산이 각각 0.37과 0.5 수준으로 분산이 다른데, 어떻게 등분산이라고 가정할 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 target 형 변환 질문
안녕하세요 작업형 2에서 target 변수가 n개의 지표로 이루어졌지만 (ex. 0: Low, 1: Mid, 2: High) info 결과 수치형이면 따로 object로 변환해주는 작업이 필요할까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[작업형1] 연습문제 섹션1 ~ 10 의 section4
df['views']의 상위 10개에 중복이 있어서, 11번째를 최소값으로 보고 풀었는데, 어떻게 생각하시는지요?10 15535.0 100 15535.0
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩과 레이블 인코딩에서 concat
drop하고 남은 train 과 test 데이터에서 유니크 수가 다른 컬럼이 있는데 레이블 인코딩에서는 concat으로 데이터를 합쳤다가 나누어주는 과정이 필요없나요?
-
미해결안정적인 AI 에이전트 서비스 운영을 위한 평가(Evaluation) 방법
agent 평가 관련 문의 드립니다.
안녕하세요. 좋은 강의 잘 들었습니다.몇가지 문의 드립니다.aevaluate 이 정상적이지 않아서 evaluate를 사용하는데, evaluate를 사용할때 wrapper 를 안쓰면 최종결과를 얻지 못할수 있어서 wrapper 를 사용한다고 하셨는데요. evaluate 의 첫번째 파라미터는 함수를 넘겨야 하니 run_agent_to_completion 를 자연스럽게 만들게 되지 않나요? run_agent_to_completion 를 안쓴다면 어떤식으로 evaluate 코드를 작성하게 되는지 궁금합니다.agent 에 따라, 질문에 대해 바로 답을 주는게 아니라 HITL 을 발생시키고, 사용자의 추가 정보에 따라 최종 답변을 주는 agent 가 있을수 있습니다. 이 경우 어떤식으로 평가를 하면 좋을까요?강의에 사용하셨던 영상에서 몇몇 부분 링크를 참고하라고 하셨는데, 링크 정보를 어디서 얻을수 있을까요? 예를들면 아래와 같은 부분 입니다. (강의소개에 적어주신 노션과 깃헙에서는 못찾아서 여쭤봅니다.)2강 - 4분 10초 경 Amazon 링크4강 - 1분 8초 경 세일즈포스트 링크" '운영에 배포할만한 가치가 있는 agent 인가?'를 평가한다 "는 말이 기억에 남습니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제2유형 질문입니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요실기시험 응시 가이드를 보면 제2유형은 pred 컬럼 하나만 생성한다고 적혀있는데, 이러면 다중분류의 roc-auc 문제는 나올 확률이 거의 없다고 봐도 될까요?
-
미해결Airflow 마스터 클래스
WSL에서 Airflow 실행 시 로컬 venv 라이브러리 사용 여부 및 관리 방법
로컬에서 venv 환경을 만들어 airflow library를 설치했는데요... venv가 github에 올라가는 것이 아니잖아요... 그럼 wsl에서 airflow 구동될 때, 쓰는 library는 무엇인가요?? 로컬과 같은 library를 쓰는 것인가요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
C()
회귀와 로지스틱 회귀 문제에서 데이터가 숫자이지만 범주형 변수라고 지정할 때에만 C()를 붙여야 한다고 하셨는데 "일원분산분석"과 "이원분산분석"에서는 ols()에서 모든 독립변수에 C()를 붙여도 되는 것이 맞나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2에서 strafity 적용 유무
안녕하세요작업형 2에서 분류 문제 시, 범주끼리 수 차이가 크면 stratify나 class_weight를 설정하는데 분류문제에서는 무조건 설정하는 것이 좋을까요??아니면 다른 하이퍼파라미터 튜닝도 제외해야 할지 고민입니다.. 저번 시험 후기를 보니 오히려 아무것도 설정하지 않은 상태가 더 점수가 높게 나왔다고 하여 고민입니다 ㅜㅜ