인프런 커뮤니티 질문&답변

미미밍님의 프로필 이미지
미미밍

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

캐글 관련 문의 및 1번 문제 질문

해결된 질문

작성

·

184

0

쌤 안녕하세요!!

  1. 지금 캐글 작업형1 1회독 끝내고 다시 2회독 하려고 하는데..

copy & edit 하면 전에 1회독때 했던 게 다시 불러와지더라고요 ㅠㅠ

혹시 이럴때 방법은 지난 번 사용했었던 노트북을 지우고 그냥 새파일로 다시 copy & edit 하는 방법밖에 없는걸까요?

 

  1. 그리고.. T1-1.Outlier(IQR) / #이상치 #IQR 문제에서 질문드립니다.

지금 약간 무지성으로 외우고만 있어서 이렇게는 안되겠다 싶어서 하나하나 보는 중인데요ㅠㅠ

캐글1질문.png지난 번에 대괄호 2번 관련해서 질문드리기도 했었고, 다른분이 질문한거 보니

df['컬럼'] = 시리즈

df[['컬럼']] = 데이터프레임

이렇게 답변하신걸 봤는데,

 

그럼 여기 답변에서 outdata2라는 df['컬럼']이 시리즈가 되어서

저 마지막 조건 outdata2['Sex'] = ='female' 에 outdata2에는 괄호가 안들어가는건가요? ㅜㅜ (시리즈라서?)

어쩔때는 df['outdata2']['Sex'] 뭐 이런식으로 들어가서 너무 헷갈려요 ㅠㅠ

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

1

소괄호는 함수입니다.

sum() 합계를 구하는 함수라서 소괄호를 사용하고 있어요

 

2

대괄호는 데이터프레임에서 컬럼을 선택할 때 사용해요

outdata2['sex']는 sex컬럼만 선택한 것입니다.

 

3

outdata2['Sex'] =='female' 은 논리연산자 ==를 사용한 조건입니다.

True 또는 False를 반환해요

 

4

True는 1이고, False는 0입니다.

sum()함수로 모두 더하게 되면 Sex컬럼에서 여성인 수만 출력할 수 있어요

 

5

df[조건]['컬럼'] 형태가 있어요

헷갈릴 수 있으니

cond = (outdata2['Sex'] =='female' )

df[cond]['컬럼명']

으로 작성하는 것을 권장하고 변수는 따옴표가 없고 컬럼을 선택할 땐 따옴표가 있어요

미미밍님의 프로필 이미지
미미밍
질문자

감사합니다!! 혹시 1번도 답해주실 수 있나요? ㅜㅜ 다 삭제하고 다시 불러와야할까요 쌤

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

your work에서 작성했던 노트북을 삭제하면 됩니다.

image

미미밍님의 프로필 이미지
미미밍

작성한 질문수

질문하기