inflearn logo
강의

Course

Instructor

How to use Pandas for financial data analysis

About Nan (How to extract dates corresponding to Nan values from a DataFrame?)

DataFrame 강의 중 About NaN 질문입니다.

329

jmin0205

1 asked

0

안녕하세요, 수업 잘 듣고 있습니다. 감사합니다.

강의 중 DataFrame 값 중 NaN인 값의 날짜를 추출하는 방법이 있었습니다.

이 부분이 잘 이해가 안가서 질문을 드립니다.

df_samsung_close.isna() 를 하게 되면, 삼성전자의 종가값이 있는 날은 False, 없는 날은 True이고 인덱스가 날짜인 데이터프레임이 조회됩니다.

따라서, df_samsung_close.isna().values를 하면 True와 False로 이루어진 numpy array가 출력됩니다.

이때 선생님께서는

df_samsung_close[df_samsung_close.isna().values].index를 이용해서 답을 찾으셨는데,

일단 데이터프레임[np array]가 의미하는 바를 모르겠습니다.

데이터프레임[np.array(true, false,...)] 했더니 true인 값만이 조회가 되는 syntax가 잘 이해가 가지 않아서요.

설명해주실 수 있나요?

pandas 투자 퀀트

Answer 1

0

quanttrader

안녕하세요 jmin02050님

답변을 늦게드려 죄송합니다. 제가 질문이 온 줄 몰라 확인을 못했습니다

우선적으로는 '데이터프레임[np.array(true, false,...)]'방식은 데이터프레임의 행 중에서 True인 값만 추출하는 형식입니다.

해당 부분에서 Numpy Array 상관없이 리스트로 해도 같은 결과가 나옵니다.

df[List(True, Fasle, Ture, ...)] -> True값만 추출되는 형식이죠.

그래서 결론적으로 데이터프레임의 값을 추출하는 방법 중 하나는 데이터프레임과 같은 shape의 True, False인 불린형식으로 되어있는 집합(Array, List ....)을 만든 후 데이터프레임에 적용해서 추출하는 방식이 있습니다.

jmin02050님께서 말씀해주신 부분을 조금 더 원론적으로 설명드리고 싶지만 제가 아직 부족해서 어떤식으로 설명드려야할지 고민이 있습니다.

 

좀 더 자세히 어떤식으로 작동하는 syntax인지는 제가 더 고민해보겠습니다.

결론적으로 데이터프레임에서 자기가 원하는 값을 추출할때, 특히나 내가 원하는 행을 True 그리고 원하지 않는 행을 False로 표현할 수 있다면, True와 False집합을 만들어 데이터프레임에 적용하면 해당 값을 뽑아낼 수 있다는 것을 말씀드리기 위해 강의에서 설명드린 부분입니다

 

혹시 해당 답변을 읽고 이해가 안되시는 부분이 있다면 계속 말씀해주시기 바랍니다

 

답변이 늦어 정말 죄송합니다

 

강의를 수강해주셔서 정말 감사합니다

 

작업형 1 유형 부분

0

10

1

작업형 1 (삭제예정, 구 버전)

0

30

2

수강기간 연장 문의드립니다.

0

21

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

24

3

수강기간 연장 문의드립니다.

0

26

1

영상에서 보이는 게 안보이는 문제

0

134

1

Anaconda Prompt 에서 pip install jupyter_contrib_nbextensions 에러

0

232

1

코랩 사용

0

258

1

콘텐츠가 안보여요!

0

186

1

21년 12월 말일 데이터 관련

0

212

1

Table of Contents에 관해 질문이 있습니다.

0

380

1

nbextensions 의 table of contents 관련 문의 드립니다.

0

1159

2

append

0

1670

1

squeeze 오류

0

698

3

주피터 노트북 nbextension 설치관련

0

920

1

강의촬영용파일

0

502

1

같은 컬럼명의 순서 찾기

0

344

1

서로 다른 길이의 두 Series 연산

0

394

1

자료는 어디서 받나요??

0

372

1

아나콘다 다운로드가 되지 않습니다.

0

1097

1

sector_list 선택관련 질문

0

203

1

단어 기준으로 원하는 데이터 찾는법

0

260

1

월별 수익률 관련 질문

1

316

1

액면분할시 최소값 0에 대해서

0

352

1