라이브러리 및 데이터 불러오기 그리고 EDA 수업내용중에
라이브러리 및 데이터 불러오기 그리고 EDA 수업내용중에
15분 36초 경에 보면 남성과 여성의 수를 확인하는데, 그때 남성의 수를 cond_male이라는 변수에 담았기 때문에 len(cond_male) 이렇게만 하면 안되나요? 왜 train[cond_male]이렇게 해주어야 하는지가 궁금합니다. 보통 데이터 프레임 안에서 컬럼을 선택할때 데이터프레임명['컬럼명'] 이런식으로 할때나 사용하는데, 변수로 지정후에도 왜 train으로 감싸나요??
답변 1
1
질문주신 내용을 가장 입문자가 혼란스러워하는 내용중 하나입니다 🙂
이때는 무조건 print()를 사용해서 출력해보세요! 그럼 이해가 좀 더 빨리 될거에요!!
1
print(cond_male)로 확인해보면
cond_male의 결과는 True 또는 False입니다.
cond_male의 결과가 True 4개, False 6개로 가정해 볼게요(아래 내용 이어짐)
2
len()함수는 행의 수를 카운트 합니다.
len(cond_male)은 총 개수인 10을 반환하지요!
3.
train[cond_male]의 결과는 True인 행만 반환합니다.
따라서 4개의 데이터프레임 행 전체가 나오겠네요
4.
구루미님의 말대로 cond_male로만 조건에 맞는 개수를 뽑고싶다면 sum()을 사용할 수 있어요!
True 는 숫자1이고, False는 숫자0이에요 모두 더하면 4가 됩니다.
결국 True의 개수와 같게 되네요!
1
아! len함수는 True, False할것없이 그냥 전체 행을 출력하기 때문에, True만 담긴 train[cond_male]을 따로 해줘야 하는 군여... 감사합니다! 이해햇어요~
출력값 질문
0
9
1
수업노트가 어디에 있나요?
0
19
1
실기시험 제출관련
0
152
2
6.20 작업형 2 과적합
0
157
3
코딩팡 장업형2 베이스 라인 인코딩 종류 질문
0
49
2
로지스틱회귀, 회귀
0
48
2
회귀 문제를 풀때 질문입니다.
0
55
1
불균형 처리 후 성능이 더 낮아졌다면,
0
61
2
실기 체험 제2유형 에러 문의
0
61
1
LIGHTGBM 으로 하면 pred값이 소수점 6자리까지 나오는게 맞나요
0
50
2
3번문제 등분산 가정
0
48
2
작업형3 target 형 변환 질문
0
35
2
[작업형1] 연습문제 섹션1 ~ 10 의 section4
0
36
3
원핫인코딩과 레이블 인코딩에서 concat
0
59
2
제2유형 질문입니다.
0
46
2
C()
0
44
2
작업형 2에서 strafity 적용 유무
0
52
2
수강 기간 연장 가능 여부 문의드립니다.
0
61
1
ols
0
43
2
2유형 작성관련 질문(일반 심화)
0
39
2
2유형 작성관련 질문
0
41
2
2유형 object컬럼 개수 다르면
0
48
2
코딩팡질문이요ㅠㅠ
0
45
2
관찰값과 기대값의 개념이 헷갈립니다.
0
25
2





