묻고 답해요
156만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
윌콕슨 검정 질문입니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 무게에서 - 120을 뺀 이유가 무엇인가요?
-
미해결[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
한단계 더 이해하는 EDA와 데이터 타입에 따른 시각화 기법5
위 코드를 실행하니 'could not convert string to float: 'Abbeville' 라는 에러가 전시됩니다.Abbeville를 float으로 바꿀 수가 있나요?
-
해결됨[리뉴얼] 처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part1]
apply axis 관련 질문
섹션7-2 5분 2초 apply부분에 apply(func, axis = 0)으로 하면 왜 '영어' 행이 하나 더 생기나요?
-
미해결
python pandas dataframe을 엑셀 vlookup처럼 활용하고 싶은데 쉽지 않습니다. 도와주세요
하고 싶은 것일부 주문이 서비스 유형: 픽업임에도 배달메뉴코드로 생성되어 이를 찾고 싶습니다. (배달메뉴와 픽업메뉴 코드는 서로 다름)엑셀 vookup을 사용해서 상품코드를 배달 메뉴 테이블에서 검색하고, 검색되지 않으면 오주문으로 판단하는 코드를 구현했습니다. 같은 프로그램을 파이썬을 통해 구현해보고 싶은데, 다른 dataframe에 없는 값을 찾아 행을 추가하는 과정이 어려워 조언을 구하고 싶습니다. 파이썬 코드df_pickup = 픽업 주문내역 데이터 프레임 delivery_menu_code = df_delivery_menu["상품코드"] df_misorder = pd.DataFrame() # 픽업 주문내역에서 상품코드를 꺼내 해당 상품코드가 배달 메뉴 코드에 포함되어 있는지 확인 # 만약에 코드가 없으면 해당 row를 df_misorder에 추가 for idx, row in df_pickup.iterrows(): misorder = df_delivery_menu[delivery_menu_code.str.contains(row["상품코드"], na = False)] if len(misorder) != 0: df_misorder.concat(row) else: pass # 어떻게 추가해도 계속 0개로 나와서, 도와주시면 감사드리겠습니다! len(df_misorder)
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
LeNet-5 실습 중 loss값 nan이 나오고 있습니다.
강의와 동일하게 코드를 쳐서 진행한 것 같은데 loss값 자체가 nan이 나오고 accuracy는 0.1을 넘기지 못하는 중입니다. 왜 이렇게 나오는 건지 알려주실 수 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제1
train 데이터를 별도 분리안하고 범주형은 라벨 인코더로 스케일링하고나서 수치형데이터도 값이 큰건 minmaxscaler나 robustscaler로 적용하고 싶어서 개별 컬럼 선택해서 적용해보는데... 에러가 뜨는데 머가 문제인지 알수 있을까요?수치형 범주형 개별로 스케일링 하고 싶으면 데이터를 분리했다가 다시 합쳐야 하는 걸까요?train['Total_Trans_Amt'] = scaler.fit_transform(train['Total_Trans_Amt']) test['Total_Trans_Amt']=scaler.transform(test['Total_Trans_Amt'])
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
완강이 된건가요?
안녕하세요, 강사님 지금 강의실에 보면섹션8에 작업형3, 가설검정 콘텐츠 제작중입니다 라고 뜨고섹션 10.에 5회 기출유형(작업형1) 강의가 업로드 되지 않았습니다.계속 강의가 업데이트 중 인가요?감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀 실습 중 rmse 결과값 질문
안녕하세요 선생님현재 모델링 및 평가(회귀)부분을 학습하고 있습니다.코드를 따라가면서 실습을 진행하고 있는데, rmse 값이 선생님과 달라 질문 드립니다.제가 알기로는 모델링을 하는 과정에서 예측한 값이 달라질 수 있고, 이에 따라 평가지표인 rmse 값이 다를 수 있다...라고 알고 있습니다.그런데 값의 차이 뿐만이 아니라 baseline과 scaler 적용 결과가 좋은지 나쁜지가 달라 질문드립니다.예를 들어, 선생님께서 하셨을때는 RandomForestRegressor의 baseline이 rmse값이 가장 좋았고(작았고), scaler를 적용했을 때 rmse가 커져서 scaler 적용은 하지 않는게 좋다~라는 내용의 실습이었는데제가 했을 때는 baseline의 rmse보다 scaler를 적용했을 때의 rmse가 작아 scaler를 적용하는 것이 좋다..는 결론이 나옵니다. 질문을 정리하자면,모델링을 하는 과정에서 선생님과 제가 실습한 예측값과 rmse가 다른게 맞는지다른게 맞다 해도 scaler 적용여부 등을 바꿀 수 있을 정도로 예측값과 rmse가 달라질 수 있는지(추가질문)달라지더라도 선생님 실습값 : 4728.xx 제 실습값 6025.174022213681 이정도로 달라질 수 있는지...(추가질문) 모델링 및 평가(회귀) 24:56에서 수험자는 알 수 없는 영역>y_test로 rmse로 구하시고 결과값이 17909.xx로 나왔는데 여기에서도 charges에 로그변환 한 이후기 떄문에 원래는 np.exp(pred)로 rmse를 구했어야 하는지일 것 같습니다. 감사합니다.
-
미해결파이썬/장고 웹서비스 개발 완벽 가이드 with 리액트
장고로 엑셀파일 편집 홈페이지 만들기 질문입니다
안녕하세요 장고로 홈페이지를 만들고 있는데 궁금한 것이 있어서 질문남겨봅니다여러 엑셀파일을 업로드 해서 각 엑셀파일별로 편집 후 파일들을 하나로 합쳐서 다운로드 받게하려는 기능을 구현하려고 하고 있습니다각 파일별 업로드 후 편집하는 것 까진 구현했는데 그 파일들을 하나로 합쳐서 다운로드 하는 것이 구현이 안되는 상황입니다이럴때 함수로 그 파일들을 합쳐서 다운로드도 가능하게 할 수 있을까요?별도의 데이터베이스는 사용하지 않으려고 합니다장고쪽인지 또는 html쪽 문제인지 궁금합니다해당 코드의 주소입니다how to merge excel file with python django - Stack Overflow감사합니다
-
해결됨[개념반] 배워서 바로 쓰는 Pandas
: 의 의미
section1. where 강의자료 문제 16번 풀이에서 첫번째 파라미터에 ':'을 입력해주셨는데 어떤 의미인가요?
-
해결됨[개념반] 배워서 바로 쓰는 Pandas
query 메서드와의 비교
조건을 주고 그에 맞는 데이터를 필터링하여 보여준다는 점에서 .loc[] 메서드와 .query() 메서드의 기능이 동일한 건가요? 다른 점이 있다면 어떤 부분에서 다른가요?
-
미해결파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') 오류
안녕하세요df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') 실행했는데 안됩니다import FinanceDataReader as fdr 은 정상작동하는거 보니 라이브러리는 깔린거 같은데요(스샷)df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') 실행하면 아래와 같이 메시지가 뜹니다--------------------------------------------------------------------------- KeyError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\computation\scope.py in resolve(self, key, is_local) 197 if self.has_resolvers: --> 198 return self.resolvers[key] 199 ~\anaconda3\lib\collections\__init__.py in __getitem__(self, key) 940 pass --> 941 return self.__missing__(key) # support subclasses that define __missing__ 942 ~\anaconda3\lib\collections\__init__.py in __missing__(self, key) 932 def __missing__(self, key): --> 933 raise KeyError(key) 934 KeyError: 'Timestamp' During handling of the above exception, another exception occurred: KeyError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\computation\scope.py in resolve(self, key, is_local) 208 # e.g., df[df > 0] --> 209 return self.temps[key] 210 except KeyError as err: KeyError: 'Timestamp' The above exception was the direct cause of the following exception: UndefinedVariableError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Call(self, node, side, **kwargs) 665 try: --> 666 res = self.visit(node.func) 667 except UndefinedVariableError: ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Name(self, node, **kwargs) 548 def visit_Name(self, node, **kwargs): --> 549 return self.term_type(node.id, self.env, **kwargs) 550 ~\anaconda3\lib\site-packages\pandas\core\computation\ops.py in __init__(self, name, env, side, encoding) 84 self.is_local = tname.startswith(LOCAL_TAG) or tname in DEFAULT_GLOBALS ---> 85 self._value = self._resolve_name() 86 self.encoding = encoding ~\anaconda3\lib\site-packages\pandas\core\computation\ops.py in _resolve_name(self) 108 --> 109 res = self.env.resolve(local_name, is_local=is_local) 110 self.update(res) ~\anaconda3\lib\site-packages\pandas\core\computation\scope.py in resolve(self, key, is_local) 210 except KeyError as err: --> 211 raise UndefinedVariableError(key, is_local) from err 212 UndefinedVariableError: name 'Timestamp' is not defined During handling of the above exception, another exception occurred: ValueError Traceback (most recent call last) ~\AppData\Local\Temp\ipykernel_6828\4160705912.py in <module> ----> 1 df1 = fdr.DataReader("005930", '2018-01-02', '2018-10-30') ~\anaconda3\lib\site-packages\FinanceDataReader\data.py in DataReader(symbol, start, end, exchange, kind) 17 if (symbol.isdigit() and len(symbol)==6 and exchange==None) or \ 18 (symbol.isdigit() and exchange and exchange.upper() in ['KRX', '한국거래소']): ---> 19 return NaverDailyReader(symbol, start, end, exchange, kind).read() 20 21 if (symbol.isdigit() and exchange and exchange.upper() in ['KRX-DELISTING']): ~\anaconda3\lib\site-packages\FinanceDataReader\naver\data.py in read(self) 27 df['Change'] = df['Close'].pct_change() 28 ---> 29 return df.query('index>=%r and index<=%r' % (self.start, self.end)) ~\anaconda3\lib\site-packages\pandas\util\_decorators.py in wrapper(*args, **kwargs) 329 stacklevel=find_stack_level(), 330 ) --> 331 return func(*args, **kwargs) 332 333 # error: "Callable[[VarArg(Any), KwArg(Any)], Any]" has no ~\anaconda3\lib\site-packages\pandas\core\frame.py in query(self, expr, inplace, **kwargs) 4472 kwargs["level"] = kwargs.pop("level", 0) + 2 4473 kwargs["target"] = None -> 4474 res = self.eval(expr, **kwargs) 4475 4476 try: ~\anaconda3\lib\site-packages\pandas\util\_decorators.py in wrapper(*args, **kwargs) 329 stacklevel=find_stack_level(), 330 ) --> 331 return func(*args, **kwargs) 332 333 # error: "Callable[[VarArg(Any), KwArg(Any)], Any]" has no ~\anaconda3\lib\site-packages\pandas\core\frame.py in eval(self, expr, inplace, **kwargs) 4610 kwargs["resolvers"] = tuple(kwargs.get("resolvers", ())) + resolvers 4611 -> 4612 return _eval(expr, inplace=inplace, **kwargs) 4613 4614 def select_dtypes(self, include=None, exclude=None) -> DataFrame: ~\anaconda3\lib\site-packages\pandas\core\computation\eval.py in eval(expr, parser, engine, truediv, local_dict, global_dict, resolvers, level, target, inplace) 351 ) 352 --> 353 parsed_expr = Expr(expr, engine=engine, parser=parser, env=env) 354 355 # construct the engine and evaluate the parsed expression ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in __init__(self, expr, engine, parser, env, level) 811 self.parser = parser 812 self._visitor = PARSERS[parser](self.env, self.engine, self.parser) --> 813 self.terms = self.parse() 814 815 @property ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in parse(self) 830 Parse an expression. 831 """ --> 832 return self._visitor.visit(self.expr) 833 834 @property ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Module(self, node, **kwargs) 419 raise SyntaxError("only a single expression is allowed") 420 expr = node.body[0] --> 421 return self.visit(expr, **kwargs) 422 423 def visit_Expr(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Expr(self, node, **kwargs) 422 423 def visit_Expr(self, node, **kwargs): --> 424 return self.visit(node.value, **kwargs) 425 426 def _rewrite_membership_op(self, node, left, right): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_BoolOp(self, node, **kwargs) 748 749 operands = node.values --> 750 return reduce(visitor, operands) 751 752 ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visitor(x, y) 741 def visit_BoolOp(self, node, **kwargs): 742 def visitor(x, y): --> 743 lhs = self._try_visit_binop(x) 744 rhs = self._try_visit_binop(y) 745 ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in _try_visit_binop(self, bop) 737 if isinstance(bop, (Op, Term)): 738 return bop --> 739 return self.visit(bop) 740 741 def visit_BoolOp(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Compare(self, node, **kwargs) 721 op = self.translate_In(ops[0]) 722 binop = ast.BinOp(op=op, left=node.left, right=comps[0]) --> 723 return self.visit(binop) 724 725 # recursive case: we have a chained comparison, a CMP b CMP c, etc. ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_BinOp(self, node, **kwargs) 534 535 def visit_BinOp(self, node, **kwargs): --> 536 op, op_class, left, right = self._maybe_transform_eq_ne(node) 537 left, right = self._maybe_downcast_constants(left, right) 538 return self._maybe_evaluate_binop(op, op_class, left, right) ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in _maybe_transform_eq_ne(self, node, left, right) 456 left = self.visit(node.left, side="left") 457 if right is None: --> 458 right = self.visit(node.right, side="right") 459 op, op_class, left, right = self._rewrite_membership_op(node, left, right) 460 return op, op_class, left, right ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit(self, node, **kwargs) 413 method = "visit_" + type(node).__name__ 414 visitor = getattr(self, method) --> 415 return visitor(node, **kwargs) 416 417 def visit_Module(self, node, **kwargs): ~\anaconda3\lib\site-packages\pandas\core\computation\expr.py in visit_Call(self, node, side, **kwargs) 668 # Check if this is a supported function name 669 try: --> 670 res = FuncNode(node.func.id) 671 except ValueError: 672 # Raise original error ~\anaconda3\lib\site-packages\pandas\core\computation\ops.py in __init__(self, name) 612 def __init__(self, name: str) -> None: 613 if name not in MATHOPS: --> 614 raise ValueError(f'"{name}" is not a supported function') 615 self.name = name 616 self.func = getattr(np, name) ValueError: "Timestamp" is not a supported function
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
numpy의 shape
안녕하세요 인프런에서 강사님의 강의(파이썬을 활용한 머신러닝 딥러닝 입문)를 수강 중인 손승운입니다.질문'파이썬을 활용한 머신러닝 딥러닝 입문' 강의 12강 내용 7분 18초를 보면 주피터 노트에서는 z.shape의 값이 (axis2, axis0, axis1) 순서로 나오고 제가 직접 주피터노트에 실습한 결과도 동일했습니다.하지만 7분 33초 중앙을 보면 shape를 (axis0, axis1, axis2)로 표현하셨는데, 이는 구글링을 통해 다른 사람들이 표현한 것과 같습니다.그럼 (axis2, axis0, axis1)와 (axis0, axis1, axis2) 둘 중 어느 것이 맞는 표현인가요? 혹시 원래는 (axis0, axis1, axis2)로 표현해야 하지만 numpy를 활용해 shape를 볼 때만 (axis2, axis0, axis1)로 표현되는 건가요?강사님의 강의 덕에 머신러닝 개발자가 되는데 한걸음 내딛을 수 있었습니다. 감사합니다. 편하신 시간에 답변주시면 감사하겠습니다.
-
미해결금융데이터 분석을 위한 판다스 활용법
append
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.안녕하세요, 시리즈 추가하는 append에서 이러한 오류가 뜹니다. FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead. concat 으로 바꿔서 하니,'DataFrame' object has no attribute 'concat'이런 오류가 뜨구요. squeeze가 돌아가지않아 빼고해서 dataframe 상태입니다.
-
미해결금융데이터 분석을 위한 판다스 활용법
squeeze 오류
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. series 불러올때 squeeze 입력하면 오류떠요.The squeeze argument has been deprecated and will be removed in a future version. Append .squeeze("columns") to the call to squeeze.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
메뉴 중에 '카페라떼'에 해당하는 가격만 보고 싶을 때는?
안녕하세요, 강의를 듣다가 궁금해서 질문을 남겨 봅니다. df.loc[1, "가격"] 이렇게 해주면 4600이렇게 해당하는 가격이 나오는 건 알겠는데요.혹시 카페라떼의 행번호르 선택하지 않고, 순수하게 "카페라떼"여기에 해당하는 가격만을 검색해서 볼 수 있는 방법은 알 수 없을까요? 듣다보면 알려주실 거 같긴 한데, 갑자기 궁금해져서 이런저런 방법을 시도해도 안 돼서 이렇게 여쭙습니다.
-
미해결[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]
mac os에서 from lightbgm import LGBMClassifier 부분이 실행되지 않을 때
안녕하세요, 같은 문제를 겪는 분들이 있으실까 싶어서 함께 공유드립니다.저의 경우 아래와 같은 이슈가 있었습니다.!pip install lightgbm > 정상 설치 완료되었다고 안내가 떴지만, 이후 강의자료에서 각 라이브러리 임포트 시 no such file 에러 발생구글링 결과 맥 사용자 일부에게서 공통적으로 나타나는 이슈인 것 같습니다. (참고 링크: https://stackoverflow.com/questions/44937698/lightgbm-oserror-library-not-loaded) 저의 경우에는 터미널을 통해 cmake 어쩌고...나오는 부분은 이해가 되지 않아 다른 답변을 찾던 중, 주피터 노트북에서 아래와 같이 실행하면 해결되었다는 답변을 발견했습니다.conda install lightgbm위 코드를 실행하고 몇 분 간 기다리면 결과 화면이 쭈욱 나오는데요, 이때 강의자료에 있는 라이브러리 임포팅 코드들을 다시 실행했더니 정상적으로 lightgbm 라이브러리 임포팅이 완료되었습니다.다만, 처음에 답변을 달아 주신 분과 저 모두 m1 mac을 사용하는 환경에서 해결되었습니다. 위의 방법으로 해결되지 않으셨을 경우에는 첨부 드린 링크 참고하시면 좋을 것 같습니다.다들 파이팅입니다. 감사합니다.
-
해결됨파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
pivot() 하니 row의 수가 줄어들었는데 이유가 무엇인지요?
2006년부터 2017년까지 12년의 ROA 탑10을 추리니 120개가 나왔습니다.그리고 컬럼과 인덱스를 설정해서 pivot을 했는데요컬럼의 숫자는 원본 데이터의 종목명인 Name인데 컬럼이 120개가 아니라 109가 되었습니다.pivot()하면 숫자가 줄어드는 이유가 무엇인지요?
-
해결됨파이썬(Python)으로 데이터 기반 주식 퀀트 투자하기 Part1
가상환경에서 FinanceDataReader import
오류패키지목록, 3.6파이썬 환경에서 FinanceDataReader import하는데 오류가 나네요jupyter-lab으로 실행 시 오류없이 진행가능하나 vscode로 진행해보고 싶어서 혹시 답변 가능할까요구글링 열심히 했는데 잘 모르겠네요
-
미해결파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
한국거래서 상장종목 에러
기존에 있었던 Market(시장)이 데이터에 없어서 예제코드 일부가 커밋이 안되고 있습니다. fdr 라이브러리를 사용해야하는 걸까요? 진행이 안되어 답답합니다.감사합니다.