inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

T1-11. min-max & 상하위 5%값

해결된 질문

163

joy10780

작성한 질문수 28

0

from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
df['f5'] = scaler.fit_transform(df[['f5']])
# print(df)

df_top = df.sort_values('f5',ascending=False)
df_bottom = df.sort_values('f5',ascending=True)
# print(df_top)
df_top5 = df_top.iloc[int(len(df_top)*0.05)-1,-1]
# print(df_bottom)
df_bottom5 = df_bottom.iloc[int(len(df_bottom)*0.05)-1,-1]

print(df_top5+df_bottom5)

저는 코드를 이렇게 작성해서 답이 동일하게 나오긴 했는데

sort를 써서 좀 복잡해진 느낌이 없지않아 있어서요

 

  1. quantile을 쓰면 자동으로 정렬이 된 후 해당하는 퍼센트 값을 return해주는건가요?

  2. 상위 몇퍼센트, 하위 몇퍼센트라는 문구를 보면 quantile를 그냥 쓴다고 생각하면 될까요?

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

1 quantile은 자동으로 정렬하는 것은 아니에요~

# 예시: 데이터프레임 df에서 'f5' 열의 상위 5%에 해당하는 값을 구하는 경우 
q = df['f5'].quantile(0.95)

와 같이 사용가능합니다.

주의할점은 상위, 하위를 잘 읽어주세요!

2 사용하는 것이 편하지 않을까요?

0

joy10780

  1. 제 코드로 했을때 복잡하긴한대 답이 동일하게 나왔다는것은

이 문제 에서 상위, 하위의 의미는 원래 데이터 순서에서가 아닌

정렬을 한 후 상위, 하위 라는 말 같은데

quantile에서 자동으로 정렬하는 기능이 없다면 어떻게 상위 하위 값을 가져오나요?

 

  1. 상위 몇퍼센트 하위 몇퍼센트

이렇게 상위 하위가 퍼센트로 표현될때 quantile쓰고

상위 몇개 하위 몇개

이렇게 제시 되었을때는 sort 사용해서 찾는다고 생각해도 될까요?

질문 드립니다.

0

38

2

강의 내용 관련 질문드립니다~

0

35

2

수강 연장 문의

0

33

1

강의자료 일괄 다운로드

0

43

2

수강기간 연장 문의드립니다

0

29

1

list 문제 질문드립니다~

0

31

2

빅분기 실기 12회 재도전

0

40

1

강의 기간 연장 가능여부 검토 요청건

0

30

1

수강기간 연장 문의 드립니다

0

36

2

수강기간 연장 문의드립니다

0

47

2

질문이요

0

51

2

수강기간 연장 문의드립니다.

0

50

2

문제 3-2 질문드립니다

0

44

2

수강기간 연장 문의 드립니다.

0

58

2

변수, 칼럼 , df 구분

0

50

2

수강기간 연장 문의드립니다.

0

50

2

수강기간 연장 문의

0

48

2

수강기간 연장 문의드립니다.

0

42

2

수강기한 연장 문의

0

80

2

수강기간 연장 문의드립니다

0

57

2

결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유

0

45

2

수강기간 연장 문의드립니다.

0

71

2

수강연장 문의

0

77

2

수강연장문의

0

53

2