inflearn logo
강의

講義

知識共有

[仕事終わりの趣味] ビッグデータ分析実技 (作業型1,2,3)

第11回 既出問題タイプ(作業型1)

2번문제 출력값 질문

3

ghdrn1399

投稿した質問数 2

0

 

2번문제 평균 계산하니깐 원래 25.055 였는데

강의에서는 print() , round()를 씌우니깐 25.022로 출력되던데

이유가 뭔가요???

저는 계속 25.055로 출력이 되네요

 

python 머신러닝 빅데이터 pandas 빅데이터분석기사

回答 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다. 강홍구님.

질문하신 내용은 Pandas의 평균 계산에서 결과값이 다르게 나오는 상황에 대한 것으로 보입니다. 일반적으로 데이터의 평균값을 계산하고 나서 반올림(round)을 하거나 print로 출력했을 때 내부적으로 처리 과정에 따라 소수점 이하 값이 달라질 수 있습니다.

원인 및 이유

  1. 부동 소수점 연산 차이: df[col].mean()의 경우 Float64 데이터 타입을 사용하기 때문에 실제 계산되는 값이 환경에 따라 미세한 수정 없이 다른 결과로 나타날 수 있습니다.
  2. Round 함수: round(df[col].mean(), 3)을 사용하여 소수점 셋째 자리로 반올림하면, round 함수에 의해 반올림 처리된 값이 부동소수점 특성상 약간 수정될 수 있습니다.
  3. 출력 환경: print(round(df[col].mean(), 3))에 따라 인식된 값이 반드시 같아지는 것이 아니라, 반올림 처리 후의 값이 출력될 수 있습니다.

추가적인 자료

유사한 사례와 해결 방안을 논의한 질문도 참고해 보시면, 이유를 더 잘 이해하실 수 있습니다.
- 59. 11회 기출 유형 작업형 1 - 문제2 관련: 소수점 처리 차이로 인한 값의 변동 사례에 대해 다루고 있습니다.
- 11회 기출 유형(작업형1) 2번 정답: 비슷한 소수점 처리 관련 문의를 다룬 내용입니다.

이러한 결과의 차이는 코드의 실행 순서 및 데이터의 상태와 관련이 있을 수 있으므로, 각 계산을 하기에 앞서 데이터를 적절히 확인하고 실행하는 것이 중요합니다. 추가적으로, 코드를 실행하기 전에 환경 초기화 등을 통해 코드가 일관된 데이터 상태에서 동작하게 하는 것도 좋은 방법입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

pd.get_dummies()가 bool로 반환

0

6

1

대응표본검정 레빈

0

15

2

단일표본검정 문제 유형

0

16

2

[작업형 3] 6~7. 카이제곱 검정

0

15

2

9회 작업형3 문제 1-1

0

20

2

최종답안 계산 방식 질문

0

15

1

시험 치기 전 급하게 질문 사항

0

25

2

유형3

0

24

2

작업형 2 연습문제 섹션 3

0

18

2

11 기출문제 ipynb파일

0

21

2

작업형 3 유형

0

22

2

11회 기출 유형(작업형1) 2번 정답

0

21

2

f1 score 질문

0

19

2

10회 작업형 2 인코딩 질의

0

16

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

21

2

28:19 roc_auc이유

0

20

2

수강연장문의

0

23

2

전체적인 머신러닝 순서

0

25

2

빅분기 실기 유형2질문

0

26

1

ID 전처리 이유

0

33

2

데이터제공

0

33

2

예시문제 작업형3 꼬리질문2번

0

22

1

데이터 개수를 구할 때, len과 value_counts 차이

0

29

2

작업형 2 제출방

0

22

2