묻고 답해요
130만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫 인코딩에서 0,1이 아니고 False,True가 나옴
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요원핫 인코딩에서 0,1이 아니고 False,True가 나옴
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 3회 작업형 2
안녕하세요 빅분기 기출 3회 작업형2 문제를 풀던중 데이터 분리와 원핫인코딩을 안하고 LabelEncoder와 랜덤 포레스트를 사용해서 문제를 풀어보았는데 마지막 csv 제출에서 데이터길이가 차이 나서 만들어지지 않는다고 뜨네요 어디를 잡아야하는지 몰라 문의드려요🥲올려주신 데이터가 아닌 다른 문제집에 있는데이터를 활용했는데 길이 차이가 나더라구여..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수업자료 다운로드
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 강사님회사에서 강의를 들으려하는데 보안 때문에 구글 드라이브 자체를 열수가 없어 파일 다운로드가 어렵네요.파일 받을 수 있는 다른 경로는 없을까요??받아서 주피터 노트북으로 학습하려고 합니다.감사합니다.
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
categorical 변수의 수치화
강의 중에 성별의 경우 성별이라는 COLUMN에 여자는 0, 남자는 1 이런식으로 하면 안 되고 여자 칼럼/남자 칼럼을 나눠줘야 한다고 하셨는데 그 이유가 뭔지 질문 드립니다! 대소관계가 없도록 하는 거라고 하셨는데, 잘 이해가 되지 않아서요! 또 그럼 반대로 ordinal category의 경우 사이즈라는 칼럼을 만들어서 L은 3, m은 2, s는 1로 한 번에 넣어도 괜찮은 건가요? 늘 감사합니다, 강사님!
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
Residual Error
앙상블의 boosting에 대해 듣던 중 질문이 있어 글을 남깁니다! residual error를 실제 값과 예측값의 차이라고 이해했는데, 검색해보니 단순 error와는 조금 다른 말이라는 이야기가 많아서요. 혹시 error와 residual error에 차이가 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
loc 함수 질문이요~
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요자주활용되는 판다스 예제에서값변경을 진행하고 있는데요! loc함수를 이용해서 원두값을 변경하려고 실행했는데AttributeError Traceback (most recent call last)<ipython-input-51-3a3e0a1a63d7> in <cell line: 3>() 1 # loc로 값 변경하기 2 # 바닐라라떼 원두 -> 과테말라로 변경----> 3 df.loc[3,'원두']="과테말라"AttributeError: 'str' object has no attribute 'loc' 위와같은 에러가 나는데 어떻게 해결하면 될까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문있습니다.
안녕하세요? 간단한 질문인데요.. df. 컬럼명 과 df["컬럼명"] 과는 무슨차이가 있나요?출력해보면 똑같은 같이 나오는데요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅데이터분석기사 기출 3회 작업형1
다른 문제집 질문도 가능 할까요? 문제 풀이 하던 중 답이 다르게 나와 질문드리고 싶어 일단 이렇게 글 올립니🥲강의 다 듣고 빅분기 문제집에 있는 기출 문제를 풀이 하던 중에 기출 3회 작업형1 2번 문제에서 강의에서 해주신 풀이 대로 풀어 보았는데 책에 있는 답이랑 달라서 질문드려요😢 해설에는 76이 나오는데 방법2 처럼 풀이하면 71이 나오네요😭 두개 다른 점이 있나요?? 봤을때 같은 답 구하는게 맞는거 같은데 왜 다른 값이 나오는지 이상해서요다음은 국가별 연도별 인구 10만명당 결핵 유병률 데이터 세트이다. 2000년도의 국가별 결핵 유병률 데이터세트에서 2000년도의 평균값보다 더 큰 유병률값을 가진 국가의 수를 계산하시오.!git clone https://github.com/AnalyticsKnight/yemoonsaBigdata/ # 데이터 불러오기 import pandas as pd df = pd.read_csv("/content/yemoonsaBigdata/datasets/Part3/302_worlddata.csv") df.head() # 방법1(해설) df_2000 = df[df['year']== 2000].drop('year', axis =1) df_2000.index = ['value'] df_2000_T = df_2000.T # print(df_2000_T['value'].mean()) rst_df = df_2000_T[df_2000_T['value'] > df_2000_T['value'].mean()] print(len(rst_df)) # 방법2 df = df.T df.head() m = df[1].mean() print(sum(df[1] > m))
-
미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
doc.groupby("컬럼명").sum() 에러
영상처럼 데이터프레임은 안나오고 에러가 나옵니다ㅠ path ="00_Material(Uploaded)/COVID-19-master/csse_covid_19_data/csse_covid_19_daily_reports/" doc = pd.read_csv(path + '04-01-2020.csv',encoding='utf-8-sig') doc = doc.groupby("Country_Region").sum() doc.head() AttributeError: 'DataFrameGroupBy' object has no attribute 'groupby'
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요
그림처럼 * 가생기고 밑에 결과가 나와야 하는데 나오지 않는 이유가 어떻게 될까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
corr() 실행 안됨
이번에 복습하면서 처음부터 수업 다시 듣고 있는데요.예전엔 corr()함수 오류없었는데, 이번엔 오류가 발생하더라고요. 혹시 상단에 코드 입력이 잘 못 되었나 일일이 다 확인해봤는데도 문제 없었고, 심지어 선생님 기본자료로 돌려봐도 똑같이 오류가 나오네요. corr() 실행 조건이 문자열 항목 있으면 안되게끔 바뀐거 같습니다. 예전에는 문자열 칼럼있어도 알아서 걸어서 계산했는데.... 앞으로 어떻게 사용하면 좋을지 알려주시면 감사하겠습니다
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
get_string함수에서 문자 'nan'
이렇게 적용시 이미 편익시설의 값에는 nan이 제거되어야 하는게 아닌가 싶은데 여기서 다시 편익시설 컬럼을 불러오면 nan이 그대로 있는 이유가 궁금합니다 !
-
미해결Pandas 팬더스 데이터분석 기초 실습
applymap이 더 이상 권장되지 않는다고 하는데요
map은 시리즈에 적용되므로 모든 칼럼에 적용이 어려운데applymap함수는 apply와 람다식으로 대체하나요??
-
미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
fillna 관련 질문 있어요
fillna가 적용이 안되어 질문 드립니다. 데이터 프레임 만들기 + 아우터 조인 을 하였습니다. ===========================================import pandas as pddf1 = pd.DataFrame({ 'id': [1, 2, 3], 'customer_id': [1, 2, 3], 'customer_name': ['Robert', 'Peter', 'Dave']}, columns=['id', 'customer_id', 'customer_name'])df1 = df1.set_index('id') df2 = pd.DataFrame({ 'id': [1, 2, 4], 'order_id': [100, 200, 300], 'order_date': ['2021-01-21', '2021-02-03', '2020-10-01']}, columns=['id', 'order_id', 'order_date'])df2 = df2.set_index('id') data_frame = pd.merge(df1, df2, how = "outer", left_index=True, right_index=True) =============================== 결과는 이렇습니다. 각 열마다 NaN값이 있단 말이죠 그래서 customer_Id / order_id, Order_date의 Nan 값들을 다른 걸로 대체하고 싶었어요 non_data = {'customer_id': 0, 'order_id':0, 'order_Date':'0000-00-00'}data_frame_fillna = data_frame.fillna(non_data)print(data_frame_fillna) 이렇게 짰는데 여전히 order_date의 NaN 값은 그대로 있습다. 뭐가 문제인걸까요 ... 했는데 order_Date라 썼네요.. 질문 쓴 김에 지우고 싶진 않고 이렇게 공부하고 있노라고 남기고 싶어 그냥 남깁니다... 부적절한 글이면 지우셔도 됩니다. 감사합니다.
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
seaborn X축 시작 지점 조정 질의의 건
강의 11:04 지점에서 코드를 돌리면 저는 아래 첨부한 것처럼 첫번째 레이블인 "2013"이 x축의 0 지점부터 시작하고 강의 내용에서는 좀 떨어져서 시작됩니다. 어떻게 하면 강의 자료처럼 설정할 수 있을까요? 하기는 제가 돌린 버전하기는 강의 자료
-
미해결공공데이터로 파이썬 데이터 분석 시작하기
14강 distplot 질의
Q1. 강의 중 seaborn 라이브러리 이용하여, distplot 이용하여 그리면 아래와 같은 경고문구가 나옵니다. 물론 그려지기는 하지만, 앞으로 distplot은 지원되지 않는 것으로 이해하면 될까요? 그럼 대체할 수 있는 방안은 무엇이 있을까 질의드립니다ㅏ! 좋은 강의 감사딃니다.C:\Users\R\anaconda3\lib\site-packages\seaborn\distributions.py:2557: FutureWarning: `distplot` is a deprecated function and will be removed in a future version. Please adapt your code to use either `displot` (a figure-level function with similar flexibility) or `histplot` (an axes-level function for histograms). warnings.warn(msg, FutureWarning)Q2. seaborn의 distplot은 데이터에 결측치가 있으면 오류가 난다고 강의에선 하셨는데, 저는 그냥 돌아가더라구요(멀쩡히?) 그러면 강의~현시점(24년 4월 초) 사이에 라이브러리가 업데이트된 것으로 이해하면 될까요? 운영 관련 문의는 1:1 문의하기를 이용해주세요.
-
미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
XML 파일 파싱 시 read_xml()함수 사용
강의 중 xml파일을 파싱하는 내용이 두 강의에 걸쳐서 길게 있는데 판다스 라이브러리 1.30 이상부터 쓸 수 있다는 pandas.read_xml 함수를 이용하면 안될까요? csv는 read_csv()를 자주 사용하는 것 같은데 xml 파일은 매번 복잡하게 데이터 프레임으로 바꿔야 하는건지 두렵네요..ㅎ 혹시 read_xml 함수를 일부로 사용하지 않으시는 거라면 그 이유도 궁금합니다!
-
미해결파이썬 무료 강의 (활용편5) - 데이터 분석 및 시각화
goupby.mean() 오류
그룹화 강의에서 df.groupby('학교').mean() 이 문을 실행했을때 TypeError가 나타나는데 강사님께서는 결과값이 잘 나옵니다. 어떤 차이인지 그리고 어떤 부분이 틀린건지 알고싶습니다.자료형 문제인거 같은데 정확히 모르겠어서 문의드립니다. <데이터><오류 내용>
-
미해결처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화까지 전과정 기본 익히기) [데이터과학 Part1]
오메 갑자기 난이도가 확 올라간 느낌입니다 ㅠ
csv 함수들이 많네요..pandas 들어가기도 전에 벌써 할께 많네용pandas에 들어가기 전 이정도 csv 함수들은 인지가 되어야 하겠죠?
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
매트릭스로 만들어주는 것
part1의 실습 - 선형회귀모델 - 당뇨병진행률 예측에서 질문 있습니다! diabetes_X를 정의할 때 reshape해주는 게 매트릭스를 만들기 위해서라고 해주셨는데요!혹시 그럼 Test 셋을 정의할 때에는 그럴 필요가 없는 건가요?(??,)인 걸 (??,1)로 만들어주는 RESHAPE를 diabetes_X할 때는 했는데, diabetes.target은 그냥 (??,) 형태인데도 따로 그 과정을 안 거치는 지 궁금합니다!