파이썬 판다스 데이터 분석과 시각화 뽀개기(Python Pandas)

파이썬 판다스 데이터 분석과 시각화 뽀개기(Python Pandas)

(25개의 수강평)

870명의 수강생
파이썬조아~ 프로필

pandas 날짜 계산 질문 드립니다. 파이썬조아~ 1달 전

안녕하세요. 멋진 강의 잘 듣고 있습니다. 

pandas 를 활용해서 날짜 계산을 하고 싶은데.

df = pd.DataFrame({"YYYYMMDD1":['20190930','20190930','20190930','20190930'],

                "YYYYMMDD2":['20190930','20190205','20190315','20190420']})

#한달 후 동일일자

df["경과일자"] = (pd.to_datetime(df["YYYYMMDD2"]) + pd.DateOffset(months=1)).dt.strftime('%Y%m%d')

#한달 후의 시작일자

df["경과일자_start"] = (pd.to_datetime(df["YYYYMMDD2"]) + pd.offsets.MonthBegin(1)).dt.strftime('%Y%m%d')

#한달 후의 마지막 일자

df["경과일자_end"] = (pd.to_datetime(df["YYYYMMDD2"]) + pd.offsets.MonthEnd(1)).dt.strftime('%Y%m%d')

result

YYYYMMDD1 YYYYMMDD2 경과일자 경과일자_start 경과일자_end
0 20190930 20190930 20191030 20191001 20191031
1 20190930 20190205 20190305 20190301 20190228
2 20190930 20190315 20190415 20190401 20190331
3 20190930 20190420 20190520 20190501 20190430

컬럼이 밀렸는데요... ㅜㅜ

마지막 컬럼상 날짜(경과일자_end)가 20191031은 제가 원하는 결과이고

그 다음 3개의 값은 20190331, 20190430, 20190531 의 결과값을 원합니다. 

어떻게 하면 직관적으로 위의 작업이 가능할까요?

감사합니다. ~~~

2
SpeedGogo 프로필

넘파이와 판다스 중 머신러닝이나 딥러닝할때 어느 것이 더 좋을까요? SpeedGogo 1달 전

넘파이와 판다스 중 하나만 잘해도 되는 것인지 아니면 둘다 잘해야하는지 궁금합니다.

아니면 둘다 다써야하나요?

2
굿투 프로필

13강 14강 굿투 1달 전

13강부터 그냥 코드만 써서 결과보여주는 느낌이라 어려워요

조금만이라도 설명을 해주시면 안되나요??

1
이강호 프로필

수료증은 확인 어떻게 하나요? 이강호 1달 전

회사 증빙을 위해 수료증 화면을 보고 싶은데, 어떻게 확인 하나요?

1
jnh7807 프로필

df.describe(include='all')에서 질문입니다. jnh7807 1달 전

섹션4의 7) 기본 통계 하기 value_counts, nunique, sum, count, mean, median 에서 질문입니다.

df.describe(include='all')을 출력하니 

강의처럼 이런 결과가 나왔습니다.

인터넷으로 검색해보았더니 top은 가장 많은 빈도수를 갖는 변수, freq는 top에 해당하는 변수의 빈도수를 의미한다는 것을 알았습니다.

그러면 여기서 unique가 의미하는 바는 무엇인지, 그리고 처음 4개의 column에서는 unique, top, freq에 해당하는 부분이 전부 NaN으로 처리가 되는지 궁금합니다.

제 생각엔 sepal_length라는 column에서도 가장 빈도수가 높은 수치들이 있을 텐데 왜 그 수치들을 표시하는 대신에 NaN을 결과로 내보내는지 이해가 되지 않습니다.

1
jnh7807 프로필

Logic in Python (and pandas) jnh7807 1달 전

섹션2의 Logic in Python(and pandas) 강의 9분 14초 부분에서 질문드립니다.

dataframe을 동시에 나타내기 위해서 논리 연산자 &를 쓰셔서 프레임을 만드셨는데요

결과값이 모두 NaN으로 나오던데 왜 이렇게 나오는지 궁금합니다.

1
Jiwon Lee 프로필

제목지정 Jiwon Lee 2달 전

중간에 apply(function) 제목지정 어떻게 하신 건지 궁금합니다!

2
허태정 프로필

27 강 강의자료는 없나요? 허태정 2달 전

27강의 강의자료가 깃헙에 없는 것 같은데

1
sypark0919@gmail.com 프로필

중간에 마크다운 표시는 어떻게 하신 건가요? sypark0919@gmail.com 2달 전

* 찍고 실행했는데 아래의 오류가 뜹니다 ㅠ

File "<ipython-input-44-2a3c585f0b01>", line 1
    * &,|,~,^,df.any(),df.all()
      ^
SyntaxError: invalid syntax

1
Jiwon Lee 프로필

실행시키기 Jiwon Lee 2달 전

df를 지정해주고 실행시킬 때 엔터키를 누르면 되는 건가요? Run 버튼을 눌러도 다음 칸만 실행되고 표가 출력되지 않습니다. 

1
ehdrbehdrb4 프로필

안녕하세요. 공부 계획에 있어서 질문을 드립니다. ehdrbehdrb4 2달 전

안녕하세요. 이번에 수강을 완료한 학생입니다.

제가 대학교에서 기본적으로 C언어, 자바, 파이썬, R 언어를 학교 강의에서 맛보기 정도 한 경험이 있었습니다.

그리고 이번에 공모전 관련해서 파이썬으로 데이터 분석 능력이 필요하게 되어 수강을 하게 되었습니다.

 

처음에는 공공데이터 분석 강의를 들을려고 하다가, 판다스에 대한 내용을 먼저 보고 가는 것이 좋겠다 싶어 이번 강의를 수강하게 되었는데요. 바로 다음에 공공데이터 분석 강의를 듣는데에는 문제가 없을까요?

다시 한번 잘 알려주셔서 감사드립니다^^

3
ㅋㅋㅋ 프로필

연산자 문의 ㅋㅋㅋ 4달 전

질문이 3개 있습니다. ㅠㅠ

 

1.

 

여기서 a가 1이고 b가 2인 행을 출력하기 위해 다음과 같이 작성했습니다.

df[df["a"] == 1] & df[df["b"] == 2]

 

그랬더니 다음과 같은 오류가 발생했네요...

TypeError: unsupported operand type(s) for &: 'float' and 'bool


이유를 잘 모르겠습니다.


2. duplicates 함수의 keep 인자의 의미를 잘 모르겠습니다.

3. np.nan을 사용한 행의 정수가 다 부동소수점으로 변경되던데 그 이유를 알고 싶습니다.



답변 주시면 감사하겠습니다. ㅠㅠ

1
이상훈 프로필

질문있습니다. 이상훈 5달 전

df.describe(include=[np.object]) 를 하면 왜 species Column 값만 나오고 나머지는 NaN값이 나오나요?

1
이상훈 프로필

질문있습니다 이상훈 5달 전

df['width'] or df.width 처럼 한 column의 값만 가져오려고 했을 시에는 DataFrame이 아니고 Series 형태?라서 DataFrame으로 값을 볼 순 없는건가요?

1
이상훈 프로필

질문있습니다 이상훈 5달 전

loc의 풀네임이 뭔가요 ?

1
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강좌들을
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스