inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

10회 기출유형 (작업형1)

최종답안 계산 방식 질문

해결된 질문

26

2142073

작성한 질문수 3

0

안녕하세요. 시험이 얼마 남지 않은 시점에서 필수함수 공부 + 노가다/육안으로 직접 확인해서 계산하기를 병행하고 있습니다.

 

이 문제는 소수점 셋째 자리까지 계산하라고 하였기 때문에 어떤 방식을 택하든 문제가 발생하진 않습니다만, 실제 시험에서 최종 답안을 계산할 때 어떤 방식이 더 맞는지 여쭙고 싶습니다.

 

[코드]

# 스팸 메시지의 평균 단어 개수와 정상 메시지의 평균 단어 개수를 각각 구하시오.

wordsdata = df.groupby(['label'])['word_count'].mean()

print(wordsdata.head())

print(abs(wordsdata.iloc[0]-wordsdata.iloc[1])) # 방법 1

print(abs(10.070026-10.022919)) # 방법 2

 

방법 1은 나름 정석(?)으로 구하는 것이고, 방법 2는 앞서 출력해본 wordsdata.head()의 결과물에 있는 숫자들을 그대로 활용하여 계산하는 방법입니다.

 

[출력결과]

> label

ham 10.070026

spam 10.022919

Name: word_count, dtype: float64

0.047106439394330124 # 방법 1 계산 결과

0.047107000000000454 # 방법 2 계산 결과

보시면 출력되는 숫자가 방법에 따라 미세하게 다름을 확인할 수 있습니다. 어떤 방법이 실전 시험에서 더 적절한지 의견 여쭙고 싶습니다. 그리고 시험 출제하시는 분들도 이런 미세한 차이를 인지하시고 소수 셋째 지점까지 구하라고 한건지도 문의드리고 싶습니다.

 

감사합니다.

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

1

퇴근후딴짓

보통 정수, 소수 둘째, 셋째가 대부분이에요

위와 같은 방식으로 풀어도 전혀 문제 없을 것으로 보입니다.

화이팅입니다!!

기출 11회 작업형 2_전체 데이터 학습 여부

0

13

1

예측값 결과 소수점 차이

0

17

2

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

14

0

전처리 train() test([ ])

0

15

2

작업형 1 배경지식 질문

0

19

2

옳게 풀은건지 질문드립니다!

0

14

1

roc_auc_score

0

22

2

추가질문 합니다

0

16

2

시험환경 구름

0

18

2

2유형 질문드려요

0

15

2

RandomForest vs lgb

0

23

2

전처리 관련질문

0

23

3

작업형3 기출

0

17

2

유형2에서 데이터분할 생략 가능여부

0

28

2

9회 기출 유형3 질문

0

19

2

lgb 기초편

0

13

1

괄호 사용

0

23

2

작업형 2 데이터 전처리 질문

0

21

1

11회 기출 유형 작업형1 문제 3-1

0

19

1

예시문제 작업형2 (ver2023) 질문입니다

0

20

2

Data type에 따른 처리

0

20

2

데이터 전처리 관련

0

18

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

25

2