inflearn logo
강의

Khóa học

Chia sẻ kiến thức

[Làm gì sau giờ làm] Chứng chỉ Phân tích Dữ liệu lớn - Kỳ thi thực hành (Dạng bài tập 1, 2, 3)

Đề thi mẫu lần thứ 10 (Dạng thực hành 1)

최종답안 계산 방식 질문

1

2142073

2 câu hỏi đã được viết

0

안녕하세요. 시험이 얼마 남지 않은 시점에서 필수함수 공부 + 노가다/육안으로 직접 확인해서 계산하기를 병행하고 있습니다.

 

이 문제는 소수점 셋째 자리까지 계산하라고 하였기 때문에 어떤 방식을 택하든 문제가 발생하진 않습니다만, 실제 시험에서 최종 답안을 계산할 때 어떤 방식이 더 맞는지 여쭙고 싶습니다.

 

[코드]

# 스팸 메시지의 평균 단어 개수와 정상 메시지의 평균 단어 개수를 각각 구하시오.

wordsdata = df.groupby(['label'])['word_count'].mean()

print(wordsdata.head())

print(abs(wordsdata.iloc[0]-wordsdata.iloc[1])) # 방법 1

print(abs(10.070026-10.022919)) # 방법 2

 

방법 1은 나름 정석(?)으로 구하는 것이고, 방법 2는 앞서 출력해본 wordsdata.head()의 결과물에 있는 숫자들을 그대로 활용하여 계산하는 방법입니다.

 

[출력결과]

> label

ham 10.070026

spam 10.022919

Name: word_count, dtype: float64

0.047106439394330124 # 방법 1 계산 결과

0.047107000000000454 # 방법 2 계산 결과

보시면 출력되는 숫자가 방법에 따라 미세하게 다름을 확인할 수 있습니다. 어떤 방법이 실전 시험에서 더 적절한지 의견 여쭙고 싶습니다. 그리고 시험 출제하시는 분들도 이런 미세한 차이를 인지하시고 소수 셋째 지점까지 구하라고 한건지도 문의드리고 싶습니다.

 

감사합니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

Câu trả lời 0

시험 치기 전 급하게 질문 사항

0

10

1

유형3

0

13

2

작업형 2 연습문제 섹션 3

0

10

2

11 기출문제 ipynb파일

0

16

2

작업형 3 유형

0

15

2

11회 기출 유형(작업형1) 2번 정답

0

17

2

f1 score 질문

0

16

2

10회 작업형 2 인코딩 질의

0

11

2

53번 강의에서 갑자기 수업노트가 없어졌습니다.

0

18

2

28:19 roc_auc이유

0

17

2

수강연장문의

0

18

2

전체적인 머신러닝 순서

0

20

2

빅분기 실기 유형2질문

0

20

1

ID 전처리 이유

0

30

2

데이터제공

0

29

2

예시문제 작업형3 꼬리질문2번

0

21

1

데이터 개수를 구할 때, len과 value_counts 차이

0

27

2

작업형 2 제출방

0

21

2

인코딩 스케일링 순서

0

21

2

실제 시험에서도 공식을 문제에서 주는지

0

21

2

수강 연장 문의

0

20

2

작업형2 정리한 내용 확인 부탁드립니다 ㅜㅜ

0

26

1

14강 "" 사용 관련 질문

0

22

2

캐글 제출 점수

0

28

2