inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

타이타닉 문제로 시작하는 EDA: 범주형 데이터 분석 패턴1 (업데이트)

판다스 데이터프래임 질문드립니다.

224

하하하핫

작성한 질문수 4

0

처음하는 파이썬 머신러닝
타이타닉 문제로 시작하는 EDA:범주형 데이터 분석 패턴1
 
약 15:54초 쯤에 나오는 함수내에 데이터프래임
survived = train[train['Survived']==1][feature].value_counts()
은 train이라는 데이터프래임중에서 조건에 맞는 값은 추려내는 문법인가요?
 
이전에 배웠던 강의에서 못본 문법같아서 문의드립니다.
혹시 이전에 강의때 위 문법이 사용되었다면 위치좀 부탁드리겠습니다....

pandas kaggle 머신러닝 배워볼래요? python

답변 1

0

잔재미코딩 DaveLee

안녕하세요.

말씀하신 부분은 train['Survived']==1 이고, 그 중에 특정 컬럼의 unique 값을 기반으로 count 를 해주는 함수가 value_counts() 입니다. 데이터프레임에 특정 조건을 [ ] 으로 지정하면 해당 조건에 맞는 데이터프레임만 추출할 수가 있습니다. 또 value_counts() 가 Series 에 대해서 이런 기능이 있고, 데이터프레임에서 특정 컬럼을 [ ]  와 같이 지정해서 선택하면 해당 데이터는 Series 가 되어요. 그래서 아래와 같은 문법이 가능한 것이었습니다.

train[train['Survived']==1][feature].value_counts()

위 각각의 문법은 기존 처음하는 데이터 분석 강의에서 설명이 된 부분이긴 해요. 각 문법을 어느 챕터의 위치로 이야기드리기는 조금 무리가 있어보이지만, 데이터프레임 초반부 설명부터, 이후 코로나 데이터를 분석하는 과정에서 설명드리고 있어서 이 부분도 한번 참고해보셔도 좋고, 위의 요약설명을 참고해보셔도 좋을 것 같습니다.

감사합니다.

 

 

자료 공유 질문

0

70

1

Ascii 에러 관련하여 질문드립니다

0

98

1

고차원 데이터 질문

0

85

1

세션4 범주형 데이터 분석 패턴 강의 질문

0

217

2

pandas 2.2.2, xgboost 2.1.3 에러 해결 방법

0

235

1

sklearn v1.5.1

0

176

1

머신러닝 적용을 위한 Feature Engineering 작업1

0

185

2

missingno 대체

0

175

1

scikit-learn 1.5.1 matplotlib 3.9.2

0

136

1

환불문의

0

273

1

자료공유를 받으려고 하는데 에러가 납니다.

0

171

1

iplot에서 항상 에러나는 분 안계신가용?

0

234

1

사망 여부 영향 가능성

0

149

1

섹션4_인코딩 이해하고 적용해보기(원핫인코딩) 질문

0

196

1

df.corr(numeric_only=True).iplot() 에러 해결 어떻게 해야되나요?

0

288

1

주피터 노트북 201_REGRESSION_BIKE_SHARING_MODELS 중 질문

0

252

1

3강 강의 자료 코드 관련 질문입니다

1

345

1

맥 사용자 mkdir .kaggle 했는데 파일이 안만들어집니다.

0

428

1

Bayesian Optimization에서 optimizer.maximize()함수를 더이상 지원 안한다고 합니다.

0

887

2

Bayesian Optimization LightGBM 적용

0

469

2

하이퍼 파라미터 튜닝 기법 적용하기 실행값이 미묘하게 달라요.

1

347

1

중복된 코드 수정 요청 - 자전거 공유 문제 이해와 EDA3

0

219

1

강의 중 에러 질문

0

756

1

cross_val_score 에러

0

470

1