inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형1] 연습문제 섹션11 ~ 20

작업형1 연습문제 17번 질문

해결된 질문

36

작성자 없음

작성한 질문수 0

0

안녕하세요

선생님께서는

# 표준편차
r1 = df['views'].std()

# 음수이거나 0 테이터 제외
cond = df['age'] <= 0
df = df[~cond]

# 소수점이 없는 값만 선택
cond = df['age'] == round(df['age'],0)
df = df[cond]

# 표준편차
r2 = df['views'].std()

print(round(r1 + r2, 2))

이렇게 코드를 작성해서 8297.31 이 나왔고 저는
print(df['views'].std())
cond1 = df['age'] > 0
cond2 = df['age'] == round(df['age'],0)
df[cond1|cond2]['views'].std()
round(4157.408065873686+4121.626455600414,2)
이렇게 8279.03 라는 값이 나왔습니다.

저의 코드도 큰 문제는 없어보이는데 답이 달라서
1. 제가 잘못 코드 작성한 것인가요?
2. 아니면 순서상의 일부분 정상적인 오차라면, 저도 정답으로 인정될 수 있나요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

삭제된 질문으로 확인!!

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. gamb21님.

질문 감사드립니다. 말씀하신 문제는 평소에 데이터를 필터링하고 표준편차를 계산하는 과정에서 발생할 수 있는 미묘한 차이에 대한 질문으로 보입니다. 이것은 데이터 처리에 있어 순서와 방법에 따라 결과가 다르게 나올 수 있음을 시사합니다.

  1. 코드의 문제점:

    • df[cond1|cond2] 조건은 이상치 처리가 다르게 하고 있습니다. 두 조건을 “OR”로 처리한다면, age가 양수이거나 정수일 때의 모든 조건에 대해 작동하게 되므로 원래 필터링 목적인 소수점 없는 양수 데이터만을 필터링하지 못할 수 있습니다. 위의 코드는 ‘양수 이거나’와 ‘정수인’ 데이터를 혼합하여 해석할 수 있어, 결과적으로 필터된 데이터 셋이 다를 수 있습니다.
    • 코드 마지막에서 r1r2를 더하는 것을 고려할 때는 df에 대한 조작이 끝난 후 같은 집합에 대한 표준편차를 맞춰야 최종 결과가 다르게 나오지 않습니다.
  2. 순서 및 정상적인 오차:

    • 코드의 논리 순서와 각 데이터에 대한 조건이 달라지는 점에서 차이를 일으킬 수 있습니다. 문제가 주어진대로 처리하여 표준을 따르는 것이 정답 처리에 중요합니다. 설정된 문제 기준을 따르는 것이 바람직하나, 만일 평가 상황에서 코드 논리를 증명할 수 있다면 다소의 변형이 있다고 하더라도 인정할 수 있겠지만, 이는 채점 기준에 따라 다를 수 있습니다.

관련 자료로 참고하실만한 질문은 다음과 같습니다:
- 4-2 type1 작업형1 6번 문제 문의드립니다.: 여기에서도 age의 이상의 데이터 필터링 시 조건 적용의 차이로 인해 발생할 수 있는 결과의 차이를 논의합니다.
- 작업형1 모의문제2 6번: 비슷한 필터링 조건을 설정하는 데 있어 나타나는 결과와 관련된 토론이 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작업형3 기출

0

6

1

유형2에서 데이터분할 생략 가능여부

0

7

1

9회 기출 유형3 질문

0

7

1

lgb 기초편

0

5

1

괄호 사용

0

8

1

작업형 2 데이터 전처리 질문

0

9

0

11회 기출 유형 작업형1 문제 3-1

0

8

0

예시문제 작업형2 (ver2023) 질문입니다

0

10

1

Data type에 따른 처리

0

6

1

데이터 전처리 관련

0

13

2

시험에서 문제 불러오기

0

12

2

2번문제 출력값 질문

0

17

2

pd.get_dummies()가 bool로 반환

0

16

2

대응표본검정 레빈

0

20

3

단일표본검정 문제 유형

0

20

2

[작업형 3] 6~7. 카이제곱 검정

0

16

2

9회 작업형3 문제 1-1

0

32

2

최종답안 계산 방식 질문

0

19

1

시험 치기 전 급하게 질문 사항

0

34

2

유형3

0

29

2

작업형 2 연습문제 섹션 3

0

19

2

11 기출문제 ipynb파일

0

32

2

작업형 3 유형

0

27

2

11회 기출 유형(작업형1) 2번 정답

0

28

2