강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của dizilog3962
dizilog3962

câu hỏi đã được viết

Tìm kiếm tín hiệu và nhiễu thông qua việc thu thập và phân tích dữ liệu chứng khoán bằng Python

[8/14] Lĩnh vực (Sector), Ngành (Industry), Khu vực (Region) nào có số lượng cổ phiếu niêm yết nhiều nhất?

isin() 으로 조회한 데이터 프레임관련 문의드립니다.

Viết

·

427

1

안녕하세요.  

isin() 함수 사용법 이해를 못해서 잘 이해가 안가는데요.

df[df["Sector"].isin(sector_count_top.index)]를 통해서

조회된 데이터 프레임의 행은 30개가 조회가 될것으로

예상했는데요. 실제 조회되는 데이터는 1,691개 로 나오고

있어서. 좀 헷갈리네요.

해당조건으로 data 에 할당을 해주고  시본으로 그래프를 그리면, 30개의 항목에 대해서만 그래프가 잘 작성되는데.

이유기 무엇인지 잘 모르겠습니다. ㅠㅠ

최고의 교육 잘 듣고 있는데,, 이해가 안되서 어려움이 있네요 :)

plotlyseabornmatplotlib웹 스크래핑웹-크롤링numpypythonpandas

Câu trả lời 2

1

dizilog3962님의 프로필 이미지
dizilog3962
Người đặt câu hỏi

안녕하세요.  답변주셔서 감사합니다.

질문에 대한 답을 정확하게 주셨습니다.  

todaycode님의 프로필 이미지
todaycode
Người chia sẻ kiến thức

다행이네요! 좋은 하루 되세요. 감사합니다 :)

1

todaycode님의 프로필 이미지
todaycode
Người chia sẻ kiến thức

안녕하세요! 최고의 강의라는 칭찬 감사합니다! 영광이에요 :)

제가 질문을 제대로 이해했는지 모르겠는데요. 제가 이해한대로 답변을 드리면,

아래 조건으로 데이터를 가져오면 sector_count_top.index 에 해당되는 30개의 섹터에 해당되는 데이터를 다 가져오기 때문에 raw 데이터 1691개를 가져온다고 보면 됩니다.


그리고 시각화를 했을 때 30개의 섹터만 보이는 이유는 섹터를 그룹화해서 표현하기 때문에 

특정 섹터에 몇개의 종목이 있는지 count 로 빈도수를 세서 표현하기 때문입니다.

제가 질문을 제대로 이해한게 맞을까요?

더 궁금한 내용이 있거나 질문의 의도와 다르다면 또 질문 부탁드릴게요!

감사합니다 :)

Hình ảnh hồ sơ của dizilog3962
dizilog3962

câu hỏi đã được viết

Đặt câu hỏi