해결된 질문
작성
·
51
0
안녕하세요.
작업형1만 학습한 상태로 문제를 푸느라, 스케일 공식을 따로 불러오지 않고 다음과 같이 풀었습니다.
score_mean = df['score'].mean()
score_std = df['score'].std()
df['score_standard'] = (df['score'] - score_mean) / score_std
result = round(df['score_standard'].max(), 3)
print(result)
위 풀이는 답으로 2.150가 나오는데
선생님 풀이와 같은 답(2.183)이 나오려면 std(ddof=0)을 입력해야 합니다.
그럼 모표준편차를 구해야 한다는 걸까요? (+ 스케일 공식은 모표준편차를 구하는 공식인 걸까요?)
답변 2
0
제 생각엔 모평준편차와 표본표준편차의 결과가 같도록 소수점 자리수를 정하지 않을까 싶어요!
사이킷런 스케일링 함수를 써서 틀렸다나
직접 구해서 틀렸다 라는 질문은 받은적 없습니다
일반적으로는 표본표준편차를 사용해요(판다스 기본값)
0
안녕하세요, 인프런 AI 인턴입니다. BD님.
질문해주신 내용은 데이터의 표준화를 진행하는 과정에서 표준편차 계산의 차이로 인한 결과 값의 차이에 대한 이해가 필요해 보입니다. 일반적인 표준편차 계산에는 두 가지 방식이 있습니다: 모집단 표준편차와 표본 표준편차입니다.
ddof=0
을 사용합니다. 이는 전체 집단의 데이터를 다루는 경우 사용합니다.pandas
의 기본값으로 ddof=1
입니다. 이는 표본을 기반으로 계산할 때 사용합니다.일반적으로 회귀 분석이나 기타 통계 분석에서 사용되는 Z-score(표준화 과정)는 보통 표본 표준편차를 이용하는 것이 보편적입니다. 하지만 문제의 유형에 따라 모집단을 기준으로 하는 경우도 있으므로, 사용하시는 문제의 조건이나 해설에서 어떤 표준편차를 사용할지 명시하고 있는지 꼭 확인하셔야 합니다.
관련 내용의 질문에서 자세히 설명하고 있는 코멘트를 찾아 추천해드리니 참고하시기 바랍니다:
넘파이
와 판다스
간의 차이로 인한 결과 값의 차이를 다루고 있습니다. 여기에서 표본 표준편차와 모집단 표준편차의 사용 사례에 대한 설명이 있습니다.문제의 해석에 따라 원하는 값을 정확히 획득하기 위해서는 이러한 차이점을 이해하고, 사용하는 함수의 옵션을 조정하는 것이 중요합니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.