inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

[작업형1] 연습문제 섹션1 ~ 10

Section 4. 값 변경, 정렬, 합계 문제 질문

해결된 질문

56

빅분기

작성한 질문수 2

1

image.pngimage.png

 

 

위는 제가 푼 풀이, 아래는 선생님의 답변입니다. 해당 문제에서 왜 최소값을 구하고 대입하는지 모르겠습니다.

문제에서 말하는 상위는 큰 숫자부터 작은 숫자로 정렬했을 때, 10번째로 큰 숫자를 말하는 상위인가요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

문제에서

상위 10번째 값 = 큰 순서로 10번째 값을 의미했어요!

만약 앞에서 부터 였다면 순서대로기 맞습니다

 

상위 10% 하위 10% 표현에서 가져왔어요!

 

10개를 슬라이싱 한 상태에서 최소 값은 10번째 값입니다 🙂

0

빅분기

앗 제가 문제 이해를 잘못했네요.

혹, 문제가 앞에서 부터 10번째 값을 의미했다면 저렇게 작성하는게 맞을까요? :)

0

퇴근후딴짓

네 맞아요

다만 iloc가 아닌 loc일때

순서가 변경(정렬)되었다면 인덱스 9번이

10번째라고 장담할 순 없어요

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 빅분기님.

주어진 문제에서는 ‘views’ 컬럼의 상위 10개 데이터를 특정 값으로 대체하는 과정에서, 상위라는 표현이 혼란을 줄 수 있습니다. 일반적으로 상위 10개의 데이터라고 하면, 큰 숫자부터 작은 숫자로 정렬했을 때 상위 순위에 있는 값들을 뜻합니다. 즉, 내림차순으로 정렬했을 때 최상위 10개의 데이터를 대상으로 해야 하는 것이 일반적입니다.

문제 해결 방법:

  1. 데이터 정렬:
    데이터를 내림차순으로 정렬한 뒤, 최상위 10개 데이터를 대체할 값을 찾습니다. ‘상위 10번째 값’이라면, 이 10개 중에서 10번째로 큰 값이 무엇인지를 의미합니다.

  2. 대체 수행:
    찾아낸 대체 값을 해당 위치에 적용합니다. 만약 ‘첫 번째 10개’라는 말이 헷갈린다면, 이것은 일반적으로 상위 10개의 데이터를 의미하며 내림차순으로 상위 10개, 즉 1번째부터 10번째까지의 데이터라고 해석됩니다.

최소값 구하기 관련 설명:

  • 선생님께서 최소값을 구하고 이를 대체 값으로 사용한 이유는 상위 Top 10개의 데이터 중 가장 낮은 값을 찾아서 나머지 상위 데이터에 동일하게 대체하기 위해서입니다. 이는 데이터의 범위를 떨어뜨리는 조작 방법 중 하나로, 특정 요건을 만족시키기 위한 처리일 수 있습니다.

참고 링크:

비슷한 문제를 다룬 게시물에서 다양한 의견과 방법론을 확인할 수 있습니다. 아래 예시는 관련 문제 풀이 과정에 대한 내용입니다:

질문자님께 해당 답변이 도움이 되었길 바랍니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?

0

6

0

전처리 train() test([ ])

0

10

2

작업형 1 배경지식 질문

0

12

2

옳게 풀은건지 질문드립니다!

0

9

1

roc_auc_score

0

14

1

추가질문 합니다

0

12

1

시험환경 구름

0

12

1

2유형 질문드려요

0

9

1

RandomForest vs lgb

0

19

1

전처리 관련질문

0

15

2

작업형3 기출

0

14

1

유형2에서 데이터분할 생략 가능여부

0

25

2

9회 기출 유형3 질문

0

15

1

lgb 기초편

0

11

1

괄호 사용

0

17

1

작업형 2 데이터 전처리 질문

0

20

1

11회 기출 유형 작업형1 문제 3-1

0

16

0

예시문제 작업형2 (ver2023) 질문입니다

0

17

1

Data type에 따른 처리

0

18

2

데이터 전처리 관련

0

16

2

시험에서 문제 불러오기

0

18

2

2번문제 출력값 질문

0

23

2

pd.get_dummies()가 bool로 반환

0

18

2

대응표본검정 레빈

0

23

3