45,100원
다른 수강생들이 자주 물어보는 질문이 궁금하신가요?
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
day_count[-50:].iloc[i]에서 질문 드립니다.
테스트를 해보니, iloc를 사용하지 않고 day_count[-50:][i]로 이차원 배열처럼 활용해도 결과는 같습니다. iloc를 사용했을때의 장점은 어떤건가요? 아니면 둘 중 어떤것을 사용해도 상관 없는건가요? 항상 좋은 강의 해주셔서 감사합니다.
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
그래프에 숫자표시관련 질문입니다.
최근 확진자가 급속히 늘어서 그런가, 100명 이상되는 경우에만 숫자를 표시하게 해도 숫자가 너무 더럽게 나오고 있습니다. 혹시, 그래프에 숫자를 표시할때 자동으로 이쁘게 위치를 조정 가능한 방법이 있을까요?
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
그래프의 색깔이 선생님의 그래프와 다릅니다.
공식문서나 제가 코드를 실행했을때는 아래와 같이 파란색으로만 나오는데, 선생님께서 작성할때는 색이 다양하게 나오네요. 기본 설정의 차이일까요? 아니면 파이썬 버전의 차이일까요?
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
코드 우측으로 정리
df = pd.DataFrame({ "a": [4, 5, 6], "b": [7, 8, 9], "c": [10, 11, 12] }, index=[1, 2, 3]) 이 코드 한번에 우측으로 정리 하시던데 어떻게 정리하는지요?? 4분26초
- 미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
쥬피터 글꼴 문의드립니다
강의 감사합니다 강의중에 노트북 글꼴 좀 알수있을까요? 디폴트 폰트가 가독성이 많이 떨어지네요 ㅠㅠ 강의와 관련있는 질문을 남겨주세요.• 강의와 관련이 없는 질문은 지식공유자가 답변하지 않을 수 있습니다. (사적 상담, 컨설팅, 과제 풀이 등)• 질문을 남기기 전, 비슷한 내용을 질문한 수강생이 있는지 먼저 검색을 해주세요. (중복 질문을 자제해주세요.)• 서비스 운영 관련 질문은 인프런 우측 하단 ‘문의하기’를 이용해주세요. (영상 재생 문제, 사이트 버그, 강의 환불 등) 질문 전달에도 요령이 필요합니다.• 지식공유자가 질문을 좀 더 쉽게 확인할 수 있게 도와주세요.• 강의실 페이지(/lecture) 에서 '질문하기'를 이용해주시면 질문과 연관된 수업 영상 제목이 함께 등록됩니다.• 강의 대시보드에서 질문을 남길 경우, 관련 섹션 및 수업 제목을 기재해주세요. • 수업 특정 구간에 대한 질문은 꼭 영상 타임코드를 남겨주세요! 구체적인 질문일수록 명확한 답을 받을 수 있어요.• 질문 제목은 핵심 키워드를 포함해 간결하게 적어주세요.• 질문 내용은 자세하게 적어주시되, 지식공유자가 답변할 수 있도록 구체적으로 남겨주세요.• 정확한 질문 내용과 함께 코드를 적어주시거나, 캡쳐 이미지를 첨부하면 더욱 좋습니다. 기본적인 예의를 지켜주세요.• 정중한 의견 및 문의 제시, 감사 인사 등의 커뮤니케이션은 더 나은 강의를 위한 기틀이 됩니다. • 질문이 있을 때에는 강의를 만든 지식공유자에 대한 기본적인 예의를 꼭 지켜주세요. • 반말, 욕설, 과격한 표현 등 지식공유자를 불쾌하게 할 수 있는 내용은 스팸 처리 등 제재를 가할 수 있습니다.
- 미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
크롤링에 오류가 있는것같습니다.
강사님을 따라 새로운 정보를 받아 파일을 생성했습니다. 그런데, 미리보기가 동영상과 다르게 보여집니다. 잘못된 정보가 들어온것같은데 어떻게 해야할지 모르겠어요 ㅠ
- 미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
공부방법질문
안녕하세요 영상잘보고있습니다 영상을 보면서 문득 궁금한점이있어서 질문드립니다 저는 판다스를 머신러닝공부를 위해 배우고있습니다 지금 강사님강의를 보면서 같이 주피터노트북으로 코드작성하는식으로 하는데요.. 이게 제가 뭔가 공부하면서 쌓인다는?느낌이없습니다.. 그니까 그냥 강사님이 하시는걸 제가 이해하고 따라하긴하는데 제가 직접 코드를 작성하고 그런수준까지는 되지않는거같습니다... 판다스를 쓸수있다라고 말한정도의 수준은 제가 직접 코드를 작성할수 있는 수준까지 되야 어느정도 판다스를 안다 라고 말할수있는건가요?? 지금 강의는 계속듣고있는데 그냥 제가 직접뭔가를 한다기보단.. 강사님이하시는걸 따라하는듯한 느낌이너무크네요 밑에부분에 실습이있는거같긴한데.. 그부분도 제가 직접 능동적을 데이터분석을하고 그런것이 아니라 그냥 강사님이 하시는걸 그대로 따라할것만같은 느낌이들어서 이런식으로 공부하는게 맞는지 모르곘습니다ㅠㅠ 데이터분석쪽으로 게속공부를해야하는데 어떤식으로 공부하는게 좋을까요?
- 미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
df[df.b == 7] & df[df.a == 5] 일 때 오류가 뜹니다.
df[df.b == 7] & df[df.a == 5] 를 하는데 동영상 처럼 정상 작동이 안되고 아래와 같은 오류가 떠요 --------------------------------------------------------------------------- TypeError Traceback (most recent call last) C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\array_ops.py in na_logical_op(x, y, op) 273 # (xint or xbool) and (yint or bool) --> 274 result = op(x, y) 275 except TypeError: TypeError: unsupported operand type(s) for &: 'float' and 'bool' During handling of the above exception, another exception occurred: TypeError Traceback (most recent call last) <ipython-input-115-a484abd3f4bf> in <module> ----> 1 df[df.b == 7] & df[df.a == 5] C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\__init__.py in f(self, other, axis, level, fill_value) 765 766 left, right = self.align(other, join="outer", level=level, copy=False) --> 767 new_data = left._combine_frame(right, pass_op, fill_value) 768 return left._construct_result(new_data) 769 C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\frame.py in _combine_frame(self, other, func, fill_value, level) 5298 if ops.should_series_dispatch(self, other, func): 5299 # iterate over columns -> 5300 new_data = ops.dispatch_to_series(self, other, _arith_op) 5301 else: 5302 with np.errstate(all="ignore"): C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\__init__.py in dispatch_to_series(left, right, func, str_rep, axis) 417 raise NotImplementedError(right) 418 --> 419 new_data = expressions.evaluate(column_op, str_rep, left, right) 420 return new_data 421 C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\computation\expressions.py in evaluate(op, op_str, a, b, use_numexpr) 206 use_numexpr = use_numexpr and _bool_arith_check(op_str, a, b) 207 if use_numexpr: --> 208 return _evaluate(op, op_str, a, b) 209 return _evaluate_standard(op, op_str, a, b) 210 C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\computation\expressions.py in _evaluate_numexpr(op, op_str, a, b) 119 120 if result is None: --> 121 result = _evaluate_standard(op, op_str, a, b) 122 123 return result C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\computation\expressions.py in _evaluate_standard(op, op_str, a, b) 68 _store_test_result(False) 69 with np.errstate(all="ignore"): ---> 70 return op(a, b) 71 72 C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\__init__.py in column_op(a, b) 386 387 def column_op(a, b): --> 388 return {i: func(a.iloc[:, i], b.iloc[:, i]) for i in range(len(a.columns))} 389 390 elif isinstance(right, ABCSeries) and axis == "columns": C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\__init__.py in <dictcomp>(.0) 386 387 def column_op(a, b): --> 388 return {i: func(a.iloc[:, i], b.iloc[:, i]) for i in range(len(a.columns))} 389 390 elif isinstance(right, ABCSeries) and axis == "columns": C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\common.py in new_method(self, other) 62 other = item_from_zerodim(other) 63 ---> 64 return method(self, other) 65 66 return new_method C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\__init__.py in wrapper(self, other) 550 rvalues = extract_array(other, extract_numpy=True) 551 --> 552 res_values = logical_op(lvalues, rvalues, op) 553 return _construct_result(self, res_values, index=self.index, name=res_name) 554 C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\array_ops.py in logical_op(left, right, op) 364 filler = fill_int if is_self_int_dtype and is_other_int_dtype else fill_bool 365 --> 366 res_values = na_logical_op(lvalues, rvalues, op) 367 res_values = filler(res_values) # type: ignore 368 C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\ops\array_ops.py in na_logical_op(x, y, op) 279 x = ensure_object(x) 280 y = ensure_object(y) --> 281 result = libops.vec_binop(x, y, op) 282 else: 283 # let null fall thru pandas\_libs\ops.pyx in pandas._libs.ops.vec_binop() pandas\_libs\ops.pyx in pandas._libs.ops.vec_binop() TypeError: unsupported operand type(s) for &: 'float' and 'bool'
- 미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
pandas read_html은 파이참 같은 IDE에서는 작동을 안하나요?
구글 코랩에서 해보니.. 되는데... 파이참에서는 안되는 것 같아 문의드립니다.
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
NaN과 Blank의 차이점 문의
강사님 질문의 꼬리를 물어서 죄송해요^^ 우선 강사님 조언대로 적용 해보았는데, df['입금'] = df['입금'].str.replace(',','') - 성공 df['입금'] = df['입금'].fillna(0) - 에러없이 작동했는데,df 불러오면 blank 그대로 나옵니다. 0이 아니라.. df['입금'] = df['입금'].astype('int64') - 에러 메세지 invalid literal for int() with base 10: '' 강사님 말씀하신 결측치 때문인거 같아서. pd.to_numeric으로 해보았습니다. df['입금'] = pd.to_numeric(df['입금']) - Data type float으로 변경 및 Blank 값이 NaN으로 변경 df['입금'] = df['입금'].astype('int64') - 에러 메세지 Cannot convert non-finite values (NA or inf) to integer 그래서 fillna(0) 하고나서 NaN이 0으로 변경후에 astype(int64)를 해주니 변경이 되었습니다. 아래와 같은 의문점이 들어서 질문 드립니다. 1. Blank와 NaN은 다른 건지요? 강사님이 말씀하신 결측치는 Blank인가요. 아님 NaN인가요? 판다스에서는 isnull 메소드 적용시 NaN 값은 인지(True) 하고. Blank는 결과를 못가져 오더라고요. 2. pd.to_numeric 은 float으로 항상 변환해 주는 건지요? 소숫점이 있어서 금액(원화) 하고 맞지 않아서 int로 변경해야 하는데, 결측치를 0으로 만들지 않고(그냥 NaN 유지) int 변경하는 방법은 없는지요? 질문의 의도가 문제를 쉽게 처리하려는 마음은 아니고, 제가 모르는 해결책이 있나 싶어 질문 드립니다.
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
데이터 전처리중 invalid literal for int() with base 10: '' 에러 문제
안녕하세요. 강사님 표제 관련하여 현장 업무 적용해 보려고 하는데, 제목과 같은 에러가 떠서요. 기본 Data set은 아래와 같고요. 입금 부분을 아래와 같이 천단위 없이 변경하려고 하였는데, 제목과 같은 에러가 떠서요. df type은 object입니다. df['입금'] = df['입금'].str.replace(',','').fillna(0).astype('int64') 인터넷을 찾아보니, Blank로 되어 있어서 그렇다고 하는데 , Fillna(0)이 있으면 해당 칼럼을 전부 0으로 바꾸어 주는 것이 아닌지요. 강의 들을 때와 다르게 실제 파일 적용하려니 상황이 달라서 그런지 시각화 하기도 전부터 막힙니다. 도와주세요.
- 미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
선생님 작성 csv 파일 사용하려 하는데 다운로드, 불러오기가 불가합니다
pd.read_csv(https://bit.ly/seoul-covid19-csv-file) File "<ipython-input-4-a727ace4aff7>", line 1 pd.read_csv(https://bit.ly/seoul-covid19-csv-file) ^ SyntaxError: invalid syntax
- 미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
6:00 부터 다음과 같은 TypeError 가 발생합니다
pd.to_datetime("2020_"+df["확진일"].str.replace(".","_")) df["확진일"] TypeError Traceback (most recent call last) /usr/local/lib/python3.6/dist-packages/pandas/core/arrays/datetimes.py in objects_to_datetime64ns(data, dayfirst, yearfirst, utc, errors, require_iso8601, allow_object) 1857 try: -> 1858 values, tz_parsed = conversion.datetime_to_datetime64(data) 1859 # If tzaware, these values represent unix timestamps, so we pandas/_libs/tslibs/conversion.pyx in pandas._libs.tslibs.conversion.datetime_to_datetime64() TypeError: Unrecognized value type: <class 'str'> During handling of the above exception, another exception occurred: ParserError Traceback (most recent call last) 7 frames pandas/_libs/tslib.pyx in pandas._libs.tslib.array_to_datetime() pandas/_libs/tslib.pyx in pandas._libs.tslib.array_to_datetime() pandas/_libs/tslib.pyx in pandas._libs.tslib.array_to_datetime_object() pandas/_libs/tslib.pyx in pandas._libs.tslib.array_to_datetime_object() pandas/_libs/tslibs/parsing.pyx in pandas._libs.tslibs.parsing.parse_datetime_string() /usr/local/lib/python3.6/dist-packages/dateutil/parser/_parser.py in parse(self, timestr, default, ignoretz, tzinfos, **kwargs) 647 648 if res is None: --> 649 raise ParserError("Unknown string format: %s", timestr) 650 651 if len(res) == 0: ParserError: Unknown string format: 2020_6_30_
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
질문 있어요
안녕하세요. 아래 처럼 False 값이 안나오고 Nan 이 나오는 경우는 어떻게 이해해야 하는지요.
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
Str 변경 관련해서 질문 드립니다.
안녕하세요. 강사님 str 변경해서 method chain 이용할때, replace는 앞에 str.를 붙이는데, map은 astype(str)를 붙이는데, 차이점은 없는데, 어떤경우에는 다르게 쓰는지 설명 부탁 합니다.
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
Colab에서 한글 폰트 설치 문의
안녕하세요. colab에서 한글 폰트 설치 하려고 하는데, 아래와 같은 에러가 나오면서 진행이 안됩니다. 강사님 유튜브 보고 참고 했는데요 확인 부탁 드립니다.
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
Slice 질문 드립니다.
강의 내용과 시점이 달라서 서울 25개 안에 기타가 들어가 있는 경우에는 Slice 중간을 뺄 수 있게 하는 Slice 방법이 있는지 궁금 하니다.
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
다시 질문 드릴께요.
우선 실습으로 정상적으로 수정은 따라 하였고요. ^^ 4:23 초에 replace 만 붙였을때 안 바뀌었는데, replace는 해당 칼럼 string이 다 일치하여야만 바뀐다고 하셨는데, 6.30. clumn은 object인데 string이 아닌지요? 아님 그 칼럼 내부에 숫자가 있으면 string이 아닌 거로 이해해야 하나요? 그 부분을 질 문을 드린겁니다. 그냥 따라서 하면 다 되는데, 궁금한 부분을 설명 요청 드렸어요.
- 해결됨단 두 장의 문서로 데이터 분석과 시각화 뽀개기
시계열 데이터 전처리 질문입니다.
강사님 replace 설명중에([5/25] 시계열 데이터 전처리4:40) 에 string이 다 일치 하지 않는 다고 설명하셨는데, 자세하게 설명 부탁합니다. 해당 날짜는 전부 object 로 보여지는데, 그렇지 않아서 앞에 str를 붙인다고 하시니 이해가 되지 않아서요. 답변 미리 감사드리고 건강 조심하세요.
- 미해결단 두 장의 문서로 데이터 분석과 시각화 뽀개기
도와주세요. 강사님
못보 신것 같아 다시 문의 드립니다. 답변 고맙습니다. DATA 불러오기 문제가 있어서 설명 부탁 할께요. 우선 회사에서 구글 사용해서 colab를 사용하고요. Spreadsheet를 불러와서 판다스 활용합니다. 그래서 gsspread(https://gspread.readthedocs.io/en/latest/api.html)설명서를 참고 하는데요. 그 부분에서 get_all_values와 가get_all_records 차이를 파악하다, 2번째 질문을 하였습니다. 현재 데이타 볼러올 때의 문제점은 Spreadsheet 아래 날짜를 읽어올 때, datatype이 int64로 바뀌고요 get_all_values(value_render_option='UNFORMATTED_VALUE') 일자 출금 2019. 10. 31 0 2019. 10. 31 1,000 2019. 10. 31 18,000 2019. 10. 31 57,450 그래서 다시 datetime으로 변경하면 df['일자'] = pd.to_datetime(df['일자']) 전혀 다른 날짜(시간포함해서)가 아래와 같이 나옵닙니다. 다른 숫자나 text는 int,object로 불러와서 이상 없이 보이는데, date는 sheet 자체에서 어떤 날짜 포맷으로 저장 문제인지 아님 api 자체내에서 불러올때 type를 지정 해야 되는 문제인지 몰라서요. 설명 해 주시면 감사하겠습니다