인프런 커뮤니티 질문&답변

breakdata00님의 프로필 이미지
breakdata00

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형3(구 버전) / 가설검정

작업형3 예시 문제 질문

해결된 질문

작성

·

336

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

 

작업형3 예시문제 1번 표본평균 구하는 문제 관련 질문드립니다.

1번 표본평균을 구할 때, df['diff'] 열을 만든 후에 바로 평균을 구한 값으로 제출하면 된다고 하셨는데 이 부분이 이해가 안 가 문의드립니다.

(df['diff'] = df['bp_after'] - df['bp_before'])

뮤 값이 (치료 후 혈압 - 치료 전 혈압)의 평균값이면df['diff']의 평균 값을 구한 후에 그 값을 다시 평균을 내야하는게 아닌가 해서요!

 

감사합니다.

답변 2

0

breakdata00님의 프로필 이미지
breakdata00
질문자

앗 넵 !!

제가 생각하는 코드로 기재하였습니다 !


df['diff'] = (df['bp_after'] - df['bp_before']).mean() 
print(round(df['diff'].mean(),2))

 

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 이 코드는 잘못되었습니다. 아래 두 코드 출력을 해서 비교해보시겠어요?

1번처럼 코딩할 경우 diff컬럼에는 모두 동일한 값이 입력됩니다.

# 1
df['diff'] = (df['bp_after'] - df['bp_before']).mean() 
print(df['diff'])

# 2
df['diff'] = (df['bp_after'] - df['bp_before']) 
print(df['diff'])
breakdata00님의 프로필 이미지
breakdata00
질문자

그러네요 !

선생님 저는

image

μ 가 (치료 후 혈압 - 치료 전 혈압)의 평균이라고 되어 있어서 평균 값을 저장해야 하는 줄 알았습니다 !

df['diff'] = (df['bp_after'] - df['bp_before'])

μ는 (치료 후 혈압 - 치료 전 혈압)의 평균이라고 되어있는데 왜 그냥

df['bp_after']에서 df[bp_before'] 뺀 값으로 저장을 하는지 모르겠습니다 ㅠㅠ

문제를 직독직해하면

μ = (치료 후 혈압 - 치료 전 혈압)의 평균을 구하고, 이 값의 표본 평균을 구해라 라고 이해가 되어서요

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

어떤 부분이 이해가 안되는지 알겠습니다.

아래 코드는 맞습니다. 이 값은 μ는 (치료 후 혈압 - 치료 전 혈압)의 평균 입니다.

(df['bp_after'] - df['bp_before']).mean() 

 

그런데 df['diff'] = 하는 것은 다른이야기에요~

df['diff'] = (df['bp_after'] - df['bp_before']).mean() 

평균값을 모든 행에 넣게 되버립니다.

 

따라서 아래 코드를 출력해도 되고

(df['bp_after'] - df['bp_before']).mean()

아래코드를 출력해도 동일한 값입니다.

df['diff'] = (df['bp_after'] - df['bp_before'])
df['diff'].mean()
breakdata00님의 프로필 이미지
breakdata00
질문자

헉 알겠습니다 !!

늦은시간에 빨리 답변해주셔서 너무 감사합니다.

좋은 강의 감사합니다 ^^

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

제가 질문을 이해를 못하겠습니다. 평균을 구하는 문제에서 어떤 부분이 문제 일까요?

breakdata00님이 생각하는 걸 코드로 표현해 주실 수 있을까요?
두 세번 읽었는데 이해를 못했어요 !! ㅠㅠ

breakdata00님의 프로필 이미지
breakdata00

작성한 질문수

질문하기