단 두 장의 문서로 데이터 분석과 시각화 뽀개기

질문드립니다

2020-05-29T04:04:27.516Z

216

지승환

작성한 질문수 1

강의내용 중에 .qcut을 사용하여 카테고리컬한 구분(bad, medium, good) 내용이 있습니다

10개의 데이터값이 2가 넘지 않는 소수 6번째짜리의 값들을 구분하였는데

낮은 값이 bad, 높은 값이 good, 중간 정도의 값이 medium으로 출력되었습니다

어떤 기준으로 .qcut 코드가 bad, good, medium을 구분하였는지 궁금합니다.

pandas python

답변 3

지승환

2020-06-01T02:57:41.397Z

감사합니다!

박조은

2020-06-01T07:30:31.612Z

감사합니다 :)

박조은

2020-05-31T05:23:11.876Z

안녕하세요.

질문 주신 내용은 binning 혹은 bucketing 이라는 기법에 쓰이는 내용입니다.

연속된 숫자로된 컬럼을 질문 주신 내용처럼 범주형태로 변환하는 것입니다.

아래 코드를 보시면 10개의 숫자를 3개의 범주 값으로 나누도록 했습니다.

값을 나누는 기준은 q 값을 정해주면 q의 값만큼 범주의 갯수를 만들게 됩니다.

여기에 보시면 precision 이라는 옵션이 있는데 이 값은 bin을 나누는 정밀도입니다.

여기에서 정밀도를 구하는 기준과 공식은 pandas 내부의 소스코드를 찾아봐야지 알것 같습니다.

precision 을 1로 지정해 주었을 때 다음의 범위에서 값을 구하게 됩니다.

-1~3, 4~6, 7~9 의 범위로 3개의 범주로 나눕니다.

그래서 label 값을 지정하지 않았을 때 아래와 같이 (3, 6, 9 ) 3가지 값으로 구분합니다.

정밀도가 3일 때 -1.001~3, 4~6, 7~9 의 범위로 3개의 범주로 나눕니다.

이걸 label 로 표현하면 아래와 같습니다.

날짜변환 에러

2023-01-09T22:09:35.879Z

268

업로드자료 오류

2023-01-05T22:09:52.084Z

385

20강 관련 문의드립니다.

2022-11-03T08:50:31.376Z

316

17강 도입부 실습사이트 문의

2022-10-29T21:37:40.294Z

315

4강 코드 오류메세지 관련 질의

2022-10-18T10:10:05.167Z

393

merge와 그룹바이 관련 질문이 있습니다.

2022-05-01T04:31:11.704Z

506

쉬운 도서 추천 좀 부탁드립니다.

2022-03-23T03:33:15.417Z

409

1강2강에 있는 csv파일을 다운받으면 한글이 깨져서 나와요

2022-02-22T09:59:11.880Z

262

주피터노트북 목록(contents) 만들기

2022-01-29T00:59:30.694Z

637

df.loc[df["거주지"].isin(gu), "지역"] = df["거주지"] 질문있습니다

2022-01-06T09:24:51.099Z

215

월 주 함꼐 value_counts()

2022-01-04T06:07:42.942Z

231

day_count.iloc[i]와 day_count[i]의 차이 질문

2022-01-03T13:27:15.513Z

358

df 인덱싱 질문입니다

2021-12-28T11:22:48.142Z

192

그래프에 한글제목을 나타내고 싶습니다.

2021-11-13T17:51:15.969Z

547

배운 것 기반으로 만들어보고 있는데 질문이 있습니다.

2021-10-14T06:31:13.283Z

411

질문이요

2021-10-13T15:15:48.103Z

310

set_index()

2021-10-13T06:41:00.762Z

296

timeit 관련 질문

2021-10-08T01:28:03.365Z

372

그래프 밑에 제목을 넣으려면 어떡해야하나요???

2021-10-07T12:58:27.131Z

434

한글폰트 설치 후 나오지 않는 현상 문의

2021-10-07T08:58:51.623Z

1192

CSV 파일 불러오기

2021-10-06T04:20:46.510Z

585

크롤링으로 csv파일 가져오기

2021-10-06T01:10:05.098Z

326

영상에서 소개해주시는 웹사이트

2021-10-04T12:46:13.097Z

265

질문

2021-10-02T16:08:58.918Z

243