단 두 장의 문서로 데이터 분석과 시각화 뽀개기

단 두 장의 문서로 데이터 분석과 시각화 뽀개기

(44개의 수강평)

1083명의 수강생
데이터 시각화PythonPandas데이터 분석
지승환 프로필

질문드립니다 지승환 2일 전

강의내용 중에 .qcut을 사용하여 카테고리컬한 구분(bad, medium, good) 내용이 있습니다

10개의 데이터값이 2가 넘지 않는 소수 6번째짜리의 값들을 구분하였는데

낮은 값이 bad, 높은 값이 good, 중간 정도의 값이 medium으로 출력되었습니다

어떤 기준으로 .qcut 코드가 bad, good, medium을 구분하였는지 궁금합니다.

1
한동규 프로필

질문입니다. 한동규 26일 전

df4.plot.hist(stacked = True,bins = 20) 코드에서 stacked = True 가 의미하는 것이 무엇인지 궁금합니다.

1
kjikse114 프로필

질문합니다! kjikse114 4달 전

강의 잘 듣고 있습니다! 

영상으로 07:30 구간과 동일한 df1, df3를 가지고 concat를 하였을 때

이러한 문구는 왜 뜨는건지, 실행에 아무 이상도 없는 것인지 궁금합니다!

1
Hyokwon Ryu 프로필

object type? Hyokwon Ryu 4달 전

object타입 이라는게 어떤의미인가요?

1
Hyokwon Ryu 프로필

'?'을 입력하고 어떤 옵션이 있는지 확인하려면 어떻게 해야하나요? Hyokwon Ryu 4달 전

'?'을 입력하고 어떤 옵션이 있는지 확인하려면 어떻게 해야하나요?

1
빛색감 프로필

10분55초 질문있습니다. 빛색감 5달 전

안녕하십니까 질문이 있습니다.

강의를 들어보니 rolling에 대한 내용은 세세하게 말씀해주셔서 이해하는데에 문제될 것이 없었으나 expanding에 대한 내용은 부족하여 이해하기 어려웠습니다.

정리를 하자면, 판다스에서 expanding이 정확히 무슨 역할을 하는 메소드인지 궁금합니다.

또한 df.expanding(2).sum()에서 expanding 뒤쪽 괄호에 2가 들어가는데 이 때 쓴 2는 무슨 역할 인지도 궁금합니다.

감사합니다.

1
페파 프로필

컬럼명이 변하는 경우의 참조 페파 5달 전

안녕하세요,

Def 기능을 사용해서 업무 프로세스를 자동화 하려 하는데, 제가 받아오는 데이터셋의 컬럼명이 계속 변경이 됩니다.

그래서 이후 후속작업이 끊기게 되는데요, 컬럼의 스트링값을 그대로 사용하는것 외에 다른 방법이 없는지요? 

아래 예에서 'PX_LAST(fill=FILL.prev,dates=RANGE(2015-01-01,2015-01-15))' 라는 컬럼이 다음번엔 다른이름으로 변경됩니다. 그래서 위치로 참조하거나 하는 방법이 있을지 궁금합니다. 

df['HCP'] = df['PX_LAST(fill=FILL.prev,dates=RANGE(2015-01-01,2015-01-15))'] / df['PX_LAST(fill=FILL.prev,dates=RANGE(2015-01-01,2015-01-15))'].shift(1) - 1
df['HCP'] = df['HCP'] *100
df

1
빛색감 프로필

질문이 있습니다. 빛색감 5달 전

Group Data 강의 중 shift 메소드에 대한 말씀을 해주신 것 중 만약 하나의 컬럼만 비어있는데 전의 값이나 후의 값으로 채우고 싶다고 한다면, 새로운 컬럼을 만들고 shift 값을 넣은 다음에 비어있는 값을 shift 값에서 가져오면 된다고 말씀을 해주셨습니다. 여기서 shift 값을 넣은 다음에 비어있는 값을 shift 값에서 가져오면 된다는 말씀이 이해가 되질 않습니다,,

1
파이썬조아~ 프로필

pandas 날짜 계산 질문 드립니다. 파이썬조아~ 7달 전

안녕하세요. 멋진 강의 잘 듣고 있습니다. 

pandas 를 활용해서 날짜 계산을 하고 싶은데.

df = pd.DataFrame({"YYYYMMDD1":['20190930','20190930','20190930','20190930'],

                "YYYYMMDD2":['20190930','20190205','20190315','20190420']})

#한달 후 동일일자

df["경과일자"] = (pd.to_datetime(df["YYYYMMDD2"]) + pd.DateOffset(months=1)).dt.strftime('%Y%m%d')

#한달 후의 시작일자

df["경과일자_start"] = (pd.to_datetime(df["YYYYMMDD2"]) + pd.offsets.MonthBegin(1)).dt.strftime('%Y%m%d')

#한달 후의 마지막 일자

df["경과일자_end"] = (pd.to_datetime(df["YYYYMMDD2"]) + pd.offsets.MonthEnd(1)).dt.strftime('%Y%m%d')

result

YYYYMMDD1 YYYYMMDD2 경과일자 경과일자_start 경과일자_end
0 20190930 20190930 20191030 20191001 20191031
1 20190930 20190205 20190305 20190301 20190228
2 20190930 20190315 20190415 20190401 20190331
3 20190930 20190420 20190520 20190501 20190430

컬럼이 밀렸는데요... ㅜㅜ

마지막 컬럼상 날짜(경과일자_end)가 20191031은 제가 원하는 결과이고

그 다음 3개의 값은 20190331, 20190430, 20190531 의 결과값을 원합니다. 

어떻게 하면 직관적으로 위의 작업이 가능할까요?

감사합니다. ~~~

2
SpeedGogo 프로필

넘파이와 판다스 중 머신러닝이나 딥러닝할때 어느 것이 더 좋을까요? SpeedGogo 7달 전

넘파이와 판다스 중 하나만 잘해도 되는 것인지 아니면 둘다 잘해야하는지 궁금합니다.

아니면 둘다 다써야하나요?

2
굿투 프로필

13강 14강 굿투 7달 전

13강부터 그냥 코드만 써서 결과보여주는 느낌이라 어려워요

조금만이라도 설명을 해주시면 안되나요??

1
이강호 프로필

수료증은 확인 어떻게 하나요? 이강호 8달 전

회사 증빙을 위해 수료증 화면을 보고 싶은데, 어떻게 확인 하나요?

1
jnh7807 프로필

df.describe(include='all')에서 질문입니다. jnh7807 8달 전

섹션4의 7) 기본 통계 하기 value_counts, nunique, sum, count, mean, median 에서 질문입니다.

df.describe(include='all')을 출력하니 

강의처럼 이런 결과가 나왔습니다.

인터넷으로 검색해보았더니 top은 가장 많은 빈도수를 갖는 변수, freq는 top에 해당하는 변수의 빈도수를 의미한다는 것을 알았습니다.

그러면 여기서 unique가 의미하는 바는 무엇인지, 그리고 처음 4개의 column에서는 unique, top, freq에 해당하는 부분이 전부 NaN으로 처리가 되는지 궁금합니다.

제 생각엔 sepal_length라는 column에서도 가장 빈도수가 높은 수치들이 있을 텐데 왜 그 수치들을 표시하는 대신에 NaN을 결과로 내보내는지 이해가 되지 않습니다.

1
jnh7807 프로필

Logic in Python (and pandas) jnh7807 8달 전

섹션2의 Logic in Python(and pandas) 강의 9분 14초 부분에서 질문드립니다.

dataframe을 동시에 나타내기 위해서 논리 연산자 &를 쓰셔서 프레임을 만드셨는데요

결과값이 모두 NaN으로 나오던데 왜 이렇게 나오는지 궁금합니다.

1
Jiwon Lee 프로필

제목지정 Jiwon Lee 8달 전

중간에 apply(function) 제목지정 어떻게 하신 건지 궁금합니다!

2
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스