묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
'KNeighborsClassifier'만 nan으로 나오는 이유를 모르겠습니다...
knn_model = KNeighborsClassifier() logreg_model = LogisticRegression() svc_model = SVC() decision_model = DecisionTreeClassifier() random_model = RandomForestClassifier() extra_model = ExtraTreesClassifier() gbm_model = GradientBoostingClassifier() nb_model = GaussianNB() xgb_model = XGBClassifier(eval_metric='logloss') lgbm_model = LGBMClassifier() models = [ knn_model, logreg_model, svc_model, decision_model, random_model, extra_model, gbm_model, nb_model, xgb_model, lgbm_model ] k_fold = KFold(n_splits=10, shuffle=True, random_state=0) # K-Fold 사용 results = dict() for alg in models: alg.fit(X_train, y_train) score = cross_val_score(alg, X_train, y_train.values.ravel(), cv=k_fold, scoring='accuracy') results[alg.__class__.__name__] = np.mean(score)*100 위 코드를 실행한 후 results를 출력해보면 아래처럼 KNeighborsClassifier 모델만 nan값이 나오는데 그 이유를 모르겠습니다.. 혹시 몰라 아래 코드처럼neighbor 수를 지정해서 돌려봐도 nan 결과가 뜨는데 이유가 있을까요...??다른 모델들도 다 안되면 데이터 문제인가 싶을텐데, knn 모델만 그래서 원인이 감이 잡히지 않습니다ㅜ knn_model = KNeighborsClassifier(n_neighbors = 3)
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
LeNet-5 실습 중 loss값 nan이 나오고 있습니다.
강의와 동일하게 코드를 쳐서 진행한 것 같은데 loss값 자체가 nan이 나오고 accuracy는 0.1을 넘기지 못하는 중입니다. 왜 이렇게 나오는 건지 알려주실 수 있을까요?
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
dataframe.iplot
항상 좋은 강의 감사드립니다!merged_order_month_count.iplot(kind='bar', theme='solar')iplot의 옵션 중에 그래프의 크기를 지정할 수 있나요 ?예를 들면, graph-object의 fig.update_layout(autosize=False, width=1000, height=800)
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
질문드립니다.
EDA/pandas/시각화로 이커머스 구매 카테고리 분석 7분 11초에서 products_category_order = products_category_order.groupby('product_category_name_english').aggregate({'order_id':'count'}).rename(columns={'order_id':'order_count'}) 에 대해 설명하신것을 들었습니다. 이거는 agg를 통해 order id의 갯수만나타낸 건데 가격의 합계를 sum으로 같이 나타내고 싶으면 어떻게 코딩을 해야하는 것인지 궁금합니다.
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
nb extensions의 table of contents 오류 문의
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.안녕하세요 강사님, nbextensions 설치하여 Files - Running - Clusters 옆 탭에 정상적으로 nbextensions가 표기되긴 합니다만, 문서 내 contents 탭을 누르면 흰색 공간만 뜨고 안에 목차가 표시되지 않습니다. 해결방법을 찾고 싶습니다.(혹시) 아래 두 번째 이미지의 노란 박스 내용이 여러 버전의 파일이 설치되어 있어 정상적으로 작동하지 않을 수 있다는 메시지 같은데, 아나콘다 터미널에서 해봤는데 되지 않아서, 쥬피터 문서에서도 돌려봤었는데요. 이것과 연관이 있는 걸까요?위 이슈가 아니더라도, 해결방법 아시면 답글 부탁드리겠습니다.
-
미해결[비전공자 대환영] 제로베이스도 쉽게 입문하는 파이썬 데이터 분석 - 캐글입문기
레몬에이드 데이터 자료에 없습니다
강의자료에 레몬에이드 파일이 없는데어디서 다운받아야 하나요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터분석기사
더운여름 잘 지내시는지요?새롭게 추가된 작업형3 유형과 1유형 통계 관련 또는 6회 기출 풀이 영상 강의 추가 계획은 없으신지요?
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
my_data
my_data 자료를 최신 자료 기준으로 실습 할 수 있도록 2020,2021,2022년도 분도 올려주시면 좋겠습니다.
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
(해결) Unexpected Character
해결완료해당 사진에서font_path 에서 Windows 앞글자를 소문자로 해서 났던 오류인가 싶습니다 (당시에는 대소문자 관게없이 같은 오류가 났어요) 검색해보니 워드클라우드에서 지원하는 폰트가 있고 아닌 폰트가 있다는것 같더라고요font_path='malgun' 라고 써주거나 기본폰트중 하나인 'HY동녘M 보통'을 사용하여 font_path="C:\Windows\Fonts\HYDNKM.TTF"라고 써주니 해결되었습니다
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
(수정) Seaborn으로 히트맵 그릴 때 문제해결 공유합니다
sns.heatmap에서 100 이상의 수가 깨지는 현상이 발생합니다해결방법year_month_new = year_month.round(0).astype(int)sns.heatmap(data=year_month_new, cmap="Blues", annot=True, fmt="d")
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
모듈 설치 오류
안녕하세요 저는 아나콘다를 통해서 설치를 했고 pip list를 통해 3개가 모두 설치 된 것을 확인했습니다. 그런데 정작 주피터에서는 아래와 같은 오류가 뜹니다. 무엇이 문제인가요. 1년전 쯤에 올려주신 방법으로도 오류가 발생해 질문 올립니다.Unable to create process using 'C:\Users\KWON\anaconda3\python.exe "C:\Users\KWON\anaconda3\Scripts\pip-script.py" install plotly chart_studio'
-
미해결평생 써먹는 데이터 기반 투자법 with 파이썬 퀀트 투자
리밸런싱에서 주기와 가중치 변경시 오류 현상
안녕하세요. 이전 맛집지도 프로젝트부터 이번 강의까지 재미있게 수강하고 있습니다. 다음 강좌도 재미있는 콘텐츠 내주시면 수강하려고 합니다.다름이 아니라, [2-5. 리밸런싱 기법]에서 강의에서는 weight를 1:1로 설정하고, Month 단위 리밸런싱만 다루는데요. 리밸런싱 주기를 quarter 또는 year로 하고 가중치를 달리 먹이면 오류가 발생합니다.closeDateSet의 날짜와 rebalancingDate의 날짜가 일치하지 않기 때문인 것 같은데요. 나름대로 열심히 손대봐도 답을 못찾아서 도움을 부탁드립니다. weight를 어떻게 집어 넣는지 다뤄주시면 좋을 것 같습니다. 감사합니다.# 데이터 로드 stockETF = getCloseData("SPY", "2002", "2022-6-17") # 주식 ETF bondETF = getCloseData("IEF", "2002", "2022-6-17") # 채권 ETF # kodex200 = 069500 # kodex10Bond = 152380 # S&P500 = SPY # 미국 7-10 국채 = IEF closeDataSet = pd.concat([stockETF, bondETF], axis=1) closeDataSet.columns = ['stockETF', 'bondETF'] closeDataSet.dropna(inplace=True) closeDataSet # 종목의 상장일을 기준으로 리밸런싱 날짜 선별 # rebalancingDate = getRebalancingDate(closeDataSet) rebalancingDate = getRebalancingDate(closeDataSet, "quarter") rebalancingDate # 리밸런싱 날짜에 맞춰서 가중치 설정 weightSet1 = pd.DataFrame({ 'stockETF': [0.7] * len(rebalancingDate), 'bondETF': [0.3] * len(rebalancingDate) }, index=rebalancingDate) # 모든 리밸런싱 날짜에 대한 가중치 지정 rebalPortfolioDayReturn, rebalPortfolioCumulativeReturn = getRebalancingPortfolioResult(closeDataSet, weightDf=weightSet1)
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
(해결완료)아나콘다 재설치후 missingno 작동이 안됩니다
(해결책)아나콘다 재설치시마지막 체크박스에 이전 설정기록을 다 삭제하도록 꼭 체크하셔야 아나콘다 재설치 후에 탈이 없습니다!! 어제 질문드린 판다스 프로파일링 문제를 겪으면서 아나콘다를 두어번 재설치하는 과정에서 missingno까지 꼬여버린 것 같습니다프롬프트 관리자 환경에서 설치를 마쳤음에도 missingno 실행이 안됩니다..2번째 수업(missingno를 처음 다뤘던 수업)에서 했던 파일을 돌려보아도 마찬가지입니다 일단은 프로파일링과 미싱노를 건너띄고 수업을 진행할 예정입니다!!
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
9분경에 나오는 for file in csv_list 코드부분에서 질문이 있습니다.
for file in csv_list: doc = create_dateframe(file) final_doc = pd.merge(final_doc, doc, how='outer', 이하생략)final_doc = final_doc.fillna(0return final_doc 이렇게 코드를 작성해도 되지 않을까?라는 생각이 들었는데, 굳이 if문을 거치는 이유가 무엇인가요?
-
미해결비트코인 선물거래 자동매매 시스템(저자직강)
갑자기 에러가 생깁니다.. 해결 방법 좀 알려주세요.
잘되던 프로그램이 불현듯long take profit-get_position_amt error msg:ExecuteError [Executing] -5000: GET /fapi/v1/positionRisk is retired, please use GET /fapi/v2/positionRisk 메세지를 내보내며 계속 오류가 납니다종목 관계없이 생기는데숏포지션은 되면서 롱에서만 생기는데 해결방법좀 알려주시면 감사하겠습니다.
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
판다스 프로파일링 호출이 안됩니다
해당 주소에 판다스 프로파일링이 버전별로 있는데 첨부한 코드와 같이 오류가 납니다..다른분들의 질문글을 읽어보고 판다스 버전도 바꿔보고 프로파일링 버전도 바꿔보고, 아나콘다 재설치도 두어번 해봤는데 도저히 해결책을 못찾겠어요..(아나콘다 재설치 과정에서 주피터와 프롬프트가 사라지기도 해서 애를 많이 먹었습니다ㅠㅠ) ipynb 파일https://drive.google.com/file/d/1bd4wdrlwevN5FneKN_fWRrDkl2q8zniY/view?usp=sharingbase.pyhttps://drive.google.com/file/d/1GcxiAhg_XTW2V5h35fnEkxmZQCYIx1YJ/view?usp=sharing
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
안녕하세요! 섹션 3의 ipynb 파일은 혹시 어디서 받을수 있나요?
제목 그대로입니다.ipynb 파일 url이 따로 소개가 되지 않아서 질문드려요
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
EDA/pandas/시각화로 이커머스 고객 상세 분석하기 강의 질문
실제 이 강의의 초반3분 안에 customers['customer_unique_id'].value_counts().max() 을 실행하면 17이라는 값이 나왔고 customers['customer_id'].value_counts().max()를 실행하면 1이라는 값이 나와 customer_id에는 중복이 없고 customer_unique_id에는 중복이 있음을 확인했었습니다.그런데 본 강의의 3분정도에서 customers['customer_id'].nunique() 을 출력하면 99441이 나오고 customers['customer_unique_id'].nunique()을 출력하면 96096이 나오는데customer_unique_id에서 중복된 것들을 다 제외시키면 customer_id의 값이 나와야 되는것 아닌지가 궁금합니다. 어떻게 이 customers['customer_unique_id'].nunique() 구문의 값이 99441이 아닌 96096이 나오게 되는지 궁금합니다. 이러면 customer_id에도 중복이 있다는 소리 아닌가요? 강사님께서 강의중에 96096이라는 숫자를 가르키시며 잘못작성하셨다고 했는데 제가 실행해도 96096이라는 숫자가 나와서요,,,ㅠ
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
지도가 갑자기 까맣게 칠해집니다..
안녕하세요 9/9강 1분20초까지 따라하던 중에 지도가 까맣게 칠해지는데 이유를 못찾겠습니다바로 이전에 그린 지도에서는 아무 문제가 없습니다 df_vs를 output 소스코드와 비교해봐도 이상이 없습니다 그런데 갑자기 지도의 일부가 까맣게 칠해지네요..40분간 검수하고 다시 돌려보고 선생님 소스코드를 붙여넣기 해봐도 원인을 찾지 못해 질문드립니다 https://drive.google.com/file/d/1XH-qxc1iBOmgBE9UXCMSgzxMYxle0oqp/view?usp=drive_link파일의 04.스벅_이디야 파일을 봐주시면 됩니다
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
4분 30초경 데이터프레임 합치는 부분 질문입니다
안녕하세요 4분 30초경 질문입니다doc = pd.merge(doc1, doc2, how='outer', left_index=True, right_index=True)를 사용하면 doc1과 doc2의 양쪽 인덱스를 기준으로 데이터프레임이 병합되는 걸로 이해했는데요left_index=True만 사용해서 왼쪽 인덱스를 기준으로 병합할 수는 없나요? doc = pd.merge(doc1, doc2, how='outer', left_index=True)를 사용하니 오류가 나고 GPT는 left_index=True)만 사용해도 병합이 가능하다고 하는데 실제로는 강의처럼 없는 날짜가 NAN이 될 줄 알았는데 오류가 발생해서 질문 드립니다