inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

핵심만 빠르게, 입문자를 위한 파이썬(Python)과 판다스(Pandas)

데이터 처리를 위한 판다스 연습문제 솔루션

Pandas 연습문제 4. apply 활용 질문

563

지루한 청어

작성한 질문수 8

0

안녕하세요, 학습하다가 이해가 되지 않는 부분이 있어 질문드립니다!

4. apply 활용

각 행에 대해 남성 인구의 합을 구하여 남자인구 합계 이름을 가진 컬럼을 생성해주세요.

위 문제에서,

def getManPopulation(row):
    man = 0
    
    for i in row.index:
        if "남자" in i:
            man += row[i]
            
    return man

sample['남자인구 합계'] = sample.apply(getManPopulation, axis=1)

sample.head()

 

getManPopulation(row):

여기 row자리에 데이터프레임(sample)이 들어간다고 생각하면

for i in row.indexrow.index가 위에서 index로 설정해놓은 '일자' 컬럼이 될텐데 어떻게 if "남자" in i가 성립되는건가요?

밑에서 row[i]를 사용하는 거 보면 row는 데이터프레임이고 i는 컬럼명이 맞는 것 같은데 이해가 되지 않아 질문드립니다.

 

감사합니다!

pandas python

답변 1

1

Jay

row.index는

남자0~9세남자10~14세남자15~19세남자20~24세남자25~29세남자30~34세...여자45~49세여자50~54세여자55~59세여자60~64세여자65~69세여자70~74세여자75~79세

이런식으로 데이터프레임 컬럼입니다.

if "남자" in i 는 컬럼명에 '남자'라는 문자열이 포함되어 있는지 검사합나다.

row[i]는 row의 value를 의미합니다. 즉, 인구수를 의미하게 됩니다.

추가적으로 row는 apply 함수를 통해 적용되는데이터프레임의 행입니다. 시리즈형 데이터라고 표현하는 것이 바른 표현입니다!

감사합니다.

0

지루한 청어

row를 데이터프레임 그 자체로 착각하고 있었네요! 데이터프레임의 행이자 시리즈형 데이터라고 말씀해주시니 이해했습니다 ㅎㅎ

매번 빠르고 친절한 설명 감사드립니다.

label 인코딩 에러 발생 원인

0

4

1

LabelEncoding 시 train data 학습(fit_transform, transform)

0

5

1

로지스틱 회귀분석은 옛날거 밖에 없나요?

0

17

2

강의 초반 질문드려요!

0

7

1

사주 정보를 넣고 웹훅

0

15

2

오류 문구 입니다.

0

16

1

creatomate를 대체할 만한 곳

0

14

1

Part2 - 19번 ~ 20번 강의 사이에 일부 내용이 생략된듯합니다.

0

21

2

Gemini 모델 변경 문의

0

16

2

소스코드 다운로드 어떻게 받는지 물어보려고 했는데...

0

7

1

판다스 표 표시

0

16

3

part2 gemini api 연동

0

16

3

알라딘 서점에서 도서목록 관련 Request정보를 찾을 수가 없습니다.

0

16

3

creatomate에서 무료 크레딧을 50밖에 안줍니다

0

14

1

구글 AI studio에서 마크다운을 받을 수 없습니다.

0

20

1

늘 컴퓨터를 켜두어야 하는 것에 대한 질문입니다.

0

28

1

MMDetection 버전 이슈

0

22

2

1유형 강의 다 나간 후 어떻게 할까요?

0

34

2

파이썬 연습문제 6번 관련 문의

0

63

1

divide 함수 축 질문

0

62

1

쥬피터노트북이 안깔려요

0

456

1

pandas 연습문제 4번 관련

0

355

1

마크다운 blank line

0

815

1

내국인 생활인구.csv 다운위치

0

602

1