묻고 답해요
161만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[개념반] 배워서 바로 쓰는 Pandas
query 메서드와의 비교
조건을 주고 그에 맞는 데이터를 필터링하여 보여준다는 점에서 .loc[] 메서드와 .query() 메서드의 기능이 동일한 건가요? 다른 점이 있다면 어떤 부분에서 다른가요?
-
미해결파이썬 코딩 기초에서 고급까지 무조건 따라하기
에스케이프 b
안녕하세요그 다음 넘어갈때마다 에스케이프 비라고 하시는데 그게 뭔가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터 분석기사 실기 출제 유형 변경
빅데이터 분석기사 실기 출제 유형이 변경 되었는데 변경내용 : 기존 단답형 10문제를 작업형 신규 유형인 '작업형 제3유형'으로 대체변경시기 : 제6회 빅데이터분석기사 실기시험(2023.06.24)부터 적용강의에 업데이트 해 주시는 지 궁금합니다.
-
해결됨파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part2
fdr.DataReader 오류
ValueError: "Timestamp" is not a supported functionfinancedatareader를 import 하면 되는데, 실제로 데이터를 불러오면 저런 에러가 뜹니다.예 : df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') 인터넷을 뒤져도 해결책이 잘 나오지 않는데 도움이 필요합니다
-
미해결평생 써먹는 데이터 기반 투자법 with 파이썬 퀀트 투자
FAA 전략에서 상관성
안녕하세요 강좌를 듣던중 궁금증이 생겨서 글 남깁니다.FAA 전략을 보면 상관성이 낮은 종목들의 순위를 높게 주려는거 같은데요.해당 수치를 계산할때 합산을 해버리면 '상관성이 낮다'의 의미는 아닌거 같습니다.abs나 **2 해서 합산을 하고 그 수치가 작은 것이 자산간의 상관관계가 낮은게 아닌가 생각됩니다.예를 들어 1과 -1 은 둘다 상관관계는 높습니다.
-
미해결파이썬을 활용한 머신러닝 딥러닝 입문
모델 적용에 대한 문의 사항
안녕하십니까.2월에 인공지능 서비스 모델 설계을 수강후 주신 쿠폰으로 좋은 교육 듣고 있습니다.몇가지 문의 사항이 있어서 연락드립니다.1. 학습된 모델을 “Model 적용” regr.predict()를 사용하여 모델적용 결과를 도출하는게 맞는지요?2. 모델에 지속적인 학습을 위해서는 regr.fit()으로 전체 데이터를 재구성하여 재 학습시키는지, 아니면 추가 데이터만 학습 시키는 방법이 있는지요?예) regr.fit(diabetes_X_curr, diabetes_y_curr)3. . 모델을 계속 적용하여 결과를 도출하고, 학습을 지속적으로 하면서 결정계수가 계속 낮아진다면 어떤 작업을 해야 하는지요?010.Simple Linear Regression 정리 자료
-
미해결파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
다른 사이트를 크롤링해보려는데 인코딩쪽에 문제가 있는 것 같습니다.
안녕하세요 선생님. 선생님 강의를 듣고 제가 원하는 사이트를 크롤링 해보려는데 인코딩문제가 생기는 것 같습니다. 사이트 주소는 이렇습니다. http://veganfesta.kr/modules/company/company_list.html?mc_code=1013import requests url = "http://veganfesta.kr/modules/company/company_view.html?seq=241&mc_code=1013" headers = { 'user-agent' : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36'} response = requests.get(url,headers=headers) response.encoding='utf-8' print(response.text)이렇게 코드를 짜봤는데요 결과는이런식으로 나옵니다. 인코딩 문제인가 하였는데response.encoding을 통해 uff-8인것을 확인했습니다.response.status는 200으로 정상이구요 ㅜ뭐가 잘못된 걸까요? 2시간가량 전전긍긍해보았지만 답을 찾지못해 선생님께 질문드립니다..제가 url을 구글이나 네이버로 바꿔 시도를 해보았을때는 잘되었는데 저 사이트로 url을 설정했을때 이렇게 나오네요.. 읽어주셔서 감사하며 답변 부탁드리겠습니다.
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part2
안녕하세요 ! 강의 내용 정리해서 github에 업로드 해도 될까요 ?
안녕하세요 ! 파트1부터 강의 잘 듣고 있습니다 !!복습하고 있는데 혹시, 강의 내용 정리해서 github에 업로드 해도 될까요 ?
-
미해결파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지
Re. Konlpy 설치오류(Okt 오류)
답변에 나온 방법을 토대로 파이썬, java, JPype, jupyter를 모두 제거한 후 재설치를 진행했습니다.python 설치 : 3.8.9 버전으로, python.org에 접속하여 인스톨러로 설치했습니다.cmd 상에서 python --version 입력하였을 시, python 3.8.9가 나오는 것을 확인했습니다.java 19.0.2를 검색하여, oracle 사이트에서 설치파일 다운로드 받아 설치하였습니다. 윈도우 64bit 버전으로 설치했습니다..시스템 환경변수 설정을 했습니다.Jpype를 말씀해주신 버전과 같은 버전으로 설치했습니다.cmd 상에서, pip install konlpy로 설치하였습니다.konlpy 설치 후 알려주신 방법을 따랐지만 기존과 같이 okt = Okt()상에서 에러가 발생합니다. 추가적으로 kkma, hannanum을 실행해보았지만 같은 에러가 발생합니다.
-
미해결파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지
Konlpy 설치 오류
konlpy설치과정에서 오류가 발생했습니다.Conda 설치가 회사 네트워크 문제로 되지 않아 프롬프트로 파이썬을 설치했고 Python은 3.8.9버전입니다. (3.9와 최신버전인 3.11로 설치했었는데 에러가 해결되지 않아 3.8로 다운그레이드 했습니다.)Java는 19.0.2(64-bit)로 설치했고 JPype는 1.1.2-cp38-win_amd64로 설치했습니다.JAVA_HOME 환경변수 설정도 확인을 완료했는데 자바 패키지상의 오류가 나타나네요ㅜㅜ
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
csv 파일 출처질문~~
혹시 국가별 코로나 확진자수 데이터인 csv 파일들은 어디서 가져오신건가요 깃허브에서 가져오신건가요. 어디에서 통계낸것이지 궁금합니다.~~
-
미해결파이썬 텍스트 분석 입문 - 데이터 수집부터 분석까지
tfidf 관련
안녕하세요, tfidf관련하여 오류가 발생하여 질문드립니다.csv파일로 뉴스를 토픽모델링하는 과정에서,csv 파일에 뉴스를 추가하면서 계속 토픽모델링을 진행하는 과정에서어느 순간에 아래처럼 오류가 발생합니다. 토픽모델링이 가능했었는데, 왜 자료를 추가하면 진행하면 어느 순간 해당 오류가 생기는지 알 수가 없어서 질문드립니다ㅠㅠ 좋은 강의해주셔서 감사합니다!UnicodeDecodeError Traceback (most recent call last) Cell In[127], line 2 1 vectorizer = TfidfVectorizer(tokenizer=tokenizer, max_df=0.90, min_df=100, max_features=20000) ----> 2 tfidf = vectorizer.fit_transform(topnews['text']).toarray() File c:\Users\My COM\AppData\Local\Programs\Python\Python310\lib\site-packages\sklearn\feature_extraction\text.py:2131, in TfidfVectorizer.fit_transform(self, raw_documents, y) 2124 self._check_params() 2125 self._tfidf = TfidfTransformer( 2126 norm=self.norm, 2127 use_idf=self.use_idf, 2128 smooth_idf=self.smooth_idf, 2129 sublinear_tf=self.sublinear_tf, 2130 ) -> 2131 X = super().fit_transform(raw_documents) 2132 self._tfidf.fit(X) 2133 # X is already a transformed view of raw_documents so 2134 # we set copy to False File c:\Users\My COM\AppData\Local\Programs\Python\Python310\lib\site-packages\sklearn\feature_extraction\text.py:1387, in CountVectorizer.fit_transform(self, raw_documents, y) 1379 warnings.warn( 1380 "Upper case characters found in" 1381 " vocabulary while 'lowercase'" 1382 " is True. These entries will not" 1383 " be matched with any documents" ... ---> 93 result = [(token.getMorph(), token.getPos()) for token in result] 95 if join: 96 result = ['{}/{}'.format(morph, pos) for morph, pos in result] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xed in position 0: invalid continuation byte
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
fdr 오류 도오ㅏ주세요 ㅠ
인증오류 질문HTTPSConnectionPool(host='fchart.stock.naver.com', port=443): Max retries exceeded with url: /sise.nhn?timeframe=day&count=6000&requestType=0&symbol=005930 (Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x000001FA2561CC70>: Failed to establish a new connection: [WinError 10060] 이렇게 뜹니다 ㅠ 크롤링 할때도 똑같이 떴어서 url 옆에 verify = False 입력하여 진행하였는데, fdr 라이브러리는 너무 방대해서 어떻게 해야할지 모르겠네요 ㅜㅠ 도와주세요
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
replot 질문
seaborn 의 retplot으로 서브플롯을 그리는 연습하는데 x축과 y축의 작은 그래프마다 label?을 다 달고싶은데가장 왼쪽과 아래에만 범주가 나오는데 이전 질분을 보니까 sharex나 sharey라는 옵셥을 사용하라고 답변을 다셨는데 이제는 사용이 안되는거 같습니다..ㅜㅜ이제는 어떤식으로해야하나요?
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
row 출력 개수 변경
선생님 row 출력 개수 변경하려고(최대 20개)pd.set_option("display.max_row", 20) 입력했고 별 에러는 안뜨는데 계속 10개만 나옵니다어떻게 해야 하나요?
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
df.nsmallest(5, "PER(배)") 중 양수값만 표출
선생님3.4(정렬) 수강 중 df.nsmallest(5, "PER(배)")을 해보면 per이 음수인데per이 양수중 가장작은 5개 종목은 어떻게 추출하나요?
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
pandas profiling 한글폰트
강사님 안녕하세요.pandas profiling 한글폰트 관련 질문이 있습니다. pandas profiling 결과에 한글이 출력은 되는데, 딱 interactions, correlations, missing values 이 3곳만 네모박스로 뜹니다. 영상보고 소스코드 3군데 수정완료한 상태입니다. 추가로 무엇을 수정해야 할 지 질문드립니다.
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') 오류
안녕하세요df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') 실행했는데 안됩니다import FinanceDataReader as fdr 은 정상작동하는거 보니 라이브러리는 깔린거 같은데요(스샷)df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') 실행하면 아래와 같이 메시지가 뜹니다--------------------------------------------------------------------------- KeyError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\computation\scope.py in resolve(self, key, is_local) 197 if self.has_resolvers: --> 198 return self.resolvers[key] 199 ~\anaconda3\lib\collections\__init__.py in __getitem__(self, key) 940 pass --> 941 return self.__missing__(key) # support subclasses that define __missing__ 942 ~\anaconda3\lib\collections\__init__.py in __missing__(self, key) 932 def __missing__(self, key): --> 933 raise KeyError(key) 934 KeyError: 'Timestamp' During handling of the above exception, another exception occurred: KeyError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\computation\scope.py in resolve(self, key, is_local) 208 # e.g., df[df > 0] --> 209 return self.temps[key] 210 except KeyError as err: KeyError: 'Timestamp' The above exception was the direct cause of the following exception: UndefinedVariableError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Call(self, node, side, **kwargs) 665 try: --> 666 res = self.visit(node.func) 667 except UndefinedVariableError: ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Name(self, node, **kwargs) 548 def visit_Name(self, node, **kwargs): --> 549 return self.term_type(node.id, self.env, **kwargs) 550 ~\anaconda3\lib\site-packages\pandas\core\computation\ops.py in __init__(self, name, env, side, encoding) 84 self.is_local = tname.startswith(LOCAL_TAG) or tname in DEFAULT_GLOBALS ---> 85 self._value = self._resolve_name() 86 self.encoding = encoding ~\anaconda3\lib\site-packages\pandas\core\computation\ops.py in _resolve_name(self) 108 --> 109 res = self.env.resolve(local_name, is_local=is_local) 110 self.update(res) ~\anaconda3\lib\site-packages\pandas\core\computation\scope.py in resolve(self, key, is_local) 210 except KeyError as err: --> 211 raise UndefinedVariableError(key, is_local) from err 212 UndefinedVariableError: name 'Timestamp' is not defined During handling of the above exception, another exception occurred: ValueError Traceback (most recent call last) ~\AppData\Local\Temp\ipykernel_6828\4160705912.py in <module> ----> 1 df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') ~\anaconda3\lib\site-packages\FinanceDataReader\data.py in DataReader(symbol, start, end, exchange, kind) 17 if (symbol.isdigit() and len(symbol)==6 and exchange==None) or \ 18 (symbol.isdigit() and exchange and exchange.upper() in ['KRX', '한국거래소']): ---> 19 return NaverDailyReader(symbol, start, end, exchange, kind).read() 20 21 if (symbol.isdigit() and exchange and exchange.upper() in ['KRX-DELISTING']): ~\anaconda3\lib\site-packages\FinanceDataReader\naver\data.py in read(self) 27 df['Change'] = df['Close'].pct_change() 28 ---> 29 return df.query('index>=%r and index<=%r' % (self.start, self.end)) ~\anaconda3\lib\site-packages\pandas\util\_decorators.py in wrapper(*args, **kwargs) 329 stacklevel=find_stack_level(), 330 ) --> 331 return func(*args, **kwargs) 332 333 # error: "Callable[[VarArg(Any), KwArg(Any)], Any]" has no ~\anaconda3\lib\site-packages\pandas\core\frame.py in query(self, expr, inplace, **kwargs) 4472 kwargs["level"] = kwargs.pop("level", 0) + 2 4473 kwargs["target"] = None -> 4474 res = self.eval(expr, **kwargs) 4475 4476 try: ~\anaconda3\lib\site-packages\pandas\util\_decorators.py in wrapper(*args, **kwargs) 329 stacklevel=find_stack_level(), 330 ) --> 331 return func(*args, **kwargs) 332 333 # error: "Callable[[VarArg(Any), KwArg(Any)], Any]" has no ~\anaconda3\lib\site-packages\pandas\core\frame.py in eval(self, expr, inplace, **kwargs) 4610 kwargs["resolvers"] = tuple(kwargs.get("resolvers", ())) + resolvers 4611 -> 4612 return _eval(expr, inplace=inplace, **kwargs) 4613 4614 def select_dtypes(self, include=None, exclude=None) -> DataFrame: ~\anaconda3\lib\site-packages\pandas\core\computation\eval.py in eval(expr, parser, engine, truediv, local_dict, global_dict, resolvers, level, target, inplace) 351 ) 352 --> 353 parsed_expr = Expr(expr, engine=engine, parser=parser, env=env) 354 355 # construct the engine and evaluate the parsed expression ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in __init__(self, expr, engine, parser, env, level) 811 self.parser = parser 812 self._visitor = PARSERS[parser](self.env, self.engine, self.parser) --> 813 self.terms = self.parse() 814 815 @property ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in parse(self) 830 Parse an expression. 831 """ --> 832 return self._visitor.visit(self.expr) 833 834 @property ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Module(self, node, **kwargs) 419 raise SyntaxError("only a single expression is allowed") 420 expr = node.body[0] --> 421 return self.visit(expr, **kwargs) 422 423 def visit_Expr(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Expr(self, node, **kwargs) 422 423 def visit_Expr(self, node, **kwargs): --> 424 return self.visit(node.value, **kwargs) 425 426 def _rewrite_membership_op(self, node, left, right): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_BoolOp(self, node, **kwargs) 748 749 operands = node.values --> 750 return reduce(visitor, operands) 751 752 ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visitor(x, y) 741 def visit_BoolOp(self, node, **kwargs): 742 def visitor(x, y): --> 743 lhs = self._try_visit_binop(x) 744 rhs = self._try_visit_binop(y) 745 ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in _try_visit_binop(self, bop) 737 if isinstance(bop, (Op, Term)): 738 return bop --> 739 return self.visit(bop) 740 741 def visit_BoolOp(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Compare(self, node, **kwargs) 721 op = self.translate_In(ops[0]) 722 binop = ast.BinOp(op=op, left=node.left, right=comps[0]) --> 723 return self.visit(binop) 724 725 # recursive case: we have a chained comparison, a CMP b CMP c, etc. ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_BinOp(self, node, **kwargs) 534 535 def visit_BinOp(self, node, **kwargs): --> 536 op, op_class, left, right = self._maybe_transform_eq_ne(node) 537 left, right = self._maybe_downcast_constants(left, right) 538 return self._maybe_evaluate_binop(op, op_class, left, right) ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in _maybe_transform_eq_ne(self, node, left, right) 456 left = self.visit(node.left, side="left") 457 if right is None: --> 458 right = self.visit(node.right, side="right") 459 op, op_class, left, right = self._rewrite_membership_op(node, left, right) 460 return op, op_class, left, right ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Call(self, node, side, **kwargs) 668 # Check if this is a supported function name 669 try: --> 670 res = FuncNode(node.func.id) 671 except ValueError: 672 # Raise original error ~\anaconda3\lib\site-packages\pandas\core\computation\ops.py in __init__(self, name) 612 def __init__(self, name: str) -> None: 613 if name not in MATHOPS: --> 614 raise ValueError(f'"{name}" is not a supported function') 615 self.name = name 616 self.func = getattr(np, name) ValueError: "Timestamp" is not a supported function
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
numpy의 shape
안녕하세요 인프런에서 강사님의 강의(파이썬을 활용한 머신러닝 딥러닝 입문)를 수강 중인 손승운입니다.질문'파이썬을 활용한 머신러닝 딥러닝 입문' 강의 12강 내용 7분 18초를 보면 주피터 노트에서는 z.shape의 값이 (axis2, axis0, axis1) 순서로 나오고 제가 직접 주피터노트에 실습한 결과도 동일했습니다.하지만 7분 33초 중앙을 보면 shape를 (axis0, axis1, axis2)로 표현하셨는데, 이는 구글링을 통해 다른 사람들이 표현한 것과 같습니다.그럼 (axis2, axis0, axis1)와 (axis0, axis1, axis2) 둘 중 어느 것이 맞는 표현인가요? 혹시 원래는 (axis0, axis1, axis2)로 표현해야 하지만 numpy를 활용해 shape를 볼 때만 (axis2, axis0, axis1)로 표현되는 건가요?강사님의 강의 덕에 머신러닝 개발자가 되는데 한걸음 내딛을 수 있었습니다. 감사합니다. 편하신 시간에 답변주시면 감사하겠습니다.
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
전처리4 영상 2분15초 ~20초
def country_name_convert 질문입니다.1.영상에는 이런식으로 되어있는데, 아래예제처럼 하면 안되는건가요, 그리고 첫번째 사진 코드에서 마지막에 return row['Country_Region']을 안하니까 2개의 행만 나오던데 3번째 줄을 한거랑 2번째줄 까지만 한건 무슨 차이인가요?2.예제처럼 하니까 오류가 생성됩니다. 위의 두코드가 어떤 차이인지 쉽게 설명해줄수 있으신가요?? 왜 안되는지