판다스 데이터프래임 질문드립니다.

Question

처음하는 파이썬 머신러닝 타이타닉 문제로 시작하는 EDA:범주형 데이터 분석 패턴1 약 15:54초 쯤에 나오는 함수내에 데이터프래임 survived = train[train['Survived']==1][feature].value_counts() 은 train이라는 데이터프래임중에서 조건에 맞는 값은 추려내는 문법인가요? 이전에 배웠던 강의에서 못본 문법같아서 문의드립니다. 혹시 이전에 강의때 위 문법이 사용되었다면 위치좀 부탁드리겠습니다....

잔재미코딩 DaveLee · Answer

안녕하세요. 말씀하신 부분은 train['Survived']==1 이고, 그 중에 특정 컬럼의 unique 값을 기반으로 count 를 해주는 함수가 value_counts() 입니다. 데이터프레임에 특정 조건을 [ ] 으로 지정하면 해당 조건에 맞는 데이터프레임만 추출할 수가 있습니다. 또 value_counts() 가 Series 에 대해서 이런 기능이 있고, 데이터프레임에서 특정 컬럼을 [ ] 와 같이 지정해서 선택하면 해당 데이터는 Series 가 되어요. 그래서 아래와 같은 문법이 가능한 것이었습니다. train[train['Survived']==1][feature].value_counts() 위 각각의 문법은 기존 처음하는 데이터 분석 강의에서 설명이 된 부분이긴 해요. 각 문법을 어느 챕터의 위치로 이야기드리기는 조금 무리가 있어보이지만, 데이터프레임 초반부 설명부터, 이후 코로나 데이터를 분석하는 과정에서 설명드리고 있어서 이 부분도 한번 참고해보셔도 좋고, 위의 요약설명을 참고해보셔도 좋을 것 같습니다. 감사합니다.