작성
·
442
0
안녕하세요, 학습하다가 이해가 되지 않는 부분이 있어 질문드립니다!
4. apply 활용
각 행에 대해 남성 인구의 합을 구하여 남자인구 합계
이름을 가진 컬럼을 생성해주세요.
위 문제에서,
def getManPopulation(row):
man = 0
for i in row.index:
if "남자" in i:
man += row[i]
return man
sample['남자인구 합계'] = sample.apply(getManPopulation, axis=1)
sample.head()
getManPopulation(row):
여기 row자리에 데이터프레임(sample)이 들어간다고 생각하면
for i in row.index
의 row.index
가 위에서 index로 설정해놓은 '일자' 컬럼이 될텐데 어떻게 if "남자" in i
가 성립되는건가요?
밑에서 row[i]
를 사용하는 거 보면 row는 데이터프레임이고 i는 컬럼명이 맞는 것 같은데 이해가 되지 않아 질문드립니다.
감사합니다!
답변 1
1
row.index는
남자0~9세남자10~14세남자15~19세남자20~24세남자25~29세남자30~34세...여자45~49세여자50~54세여자55~59세여자60~64세여자65~69세여자70~74세여자75~79세
이런식으로 데이터프레임 컬럼입니다.
if "남자" in i 는 컬럼명에 '남자'라는 문자열이 포함되어 있는지 검사합나다.
row[i]는 row의 value를 의미합니다. 즉, 인구수를 의미하게 됩니다.
추가적으로 row는 apply 함수를 통해 적용되는데이터프레임의 행입니다. 시리즈형 데이터라고 표현하는 것이 바른 표현입니다!
감사합니다.
row를 데이터프레임 그 자체로 착각하고 있었네요! 데이터프레임의 행이자 시리즈형 데이터라고 말씀해주시니 이해했습니다 ㅎㅎ
매번 빠르고 친절한 설명 감사드립니다.