random,randn(1000) 함수 질문드립니다
886
작성한 질문수 6
이코드가 a 컬럼에 1000개의 랜덤숫자 들어간다고 설명주셨는대요
히스토그램 보면 대부분 -4 ~ +4 까지 분포 되있습니다
랜덤한 숫자 범위가 -4 에서 + 4까지 라는 정의는 어디 있는건가요,
아니면 그이상 범위의 랜덤한 숫자는 발생할 확률이 거의 없다는건가요
그리고 인덱스4부터 994까지 데이터 생략되서 화면에 나오는대
생략된거 보려면 어떻게 해야되나요
답변 4
2
코드를 직접 실습해 보실 수 있도록 colab링크를 생성했습니다.
아래 링크에서 위 답변 내용을 확인해 보실 수 있습니다.
2
안녕하세요. 좋은 질문을 주셨네요.
import numpy as np
import pandas as pd
# 0부터 1사이의 균일 분포를 난수로 생성합니다.
rand = np.random.rand(100)
# 100개의 난수 중에 앞에서 10개의 난수만 슬라이싱으로 가져와서 미리보기를 합니다.
rand[:10]
# 가우시안 분포(표준 정규분포)를 생성합니다.
randn = np.random.randn(100)
randn[:10]
# 균일분포의 정수 난수를 생성합니다.
randint = np.random.randint(1, 10, 100)
randint[:10]
# 위에서 만든 값을 데이터프레임으로 만들어서 비교를 합니다.
df = pd.DataFrame({"rand": rand, "randn": randn, "randint": randint})
# 3가지 난수 생성방법으로 생성된 값을 비교해 보기 위해 그래프를 그립니다.
# legend 값을 확인해 주세요.
df.plot(figsize=(15, 4))
# 같은 값을 히스토그램으로 그립니다.
# rand, randint의 난수생성값에 대해 각 구간의 값의 빈도수를 표현합니다.
# randn은 정규분포(수학자 가우스의 이름을 따서 보통 가우시안 분포라고 부릅니다.) 형태로 난수를 생성한 것을 볼 수 있습니다.
h = df.hist(figsize=(15, 8), bins=6)
# randn은 다른 분포와 다르게 정규분포 형태의 분포를 생성합니다.
df.plot.hist(alpha=0.5, bins=6)
df4 = pd.DataFrame({'a': np.random.randn(1000) + 1,
'b': np.random.randn(1000),
'c': np.random.randn(1000) - 1},
columns=['a', 'b', 'c'])
# 아래에 ... 으로 생략된 값이 나오는데 생략된 값을 모두 보려면
# 아래의 코드의 주석을 풀고 작성해 주시면 최대 1000개의 행까지 보입니다.
# pd.options.display.max_rows=1000
df4
# 그래프에서 이 값은 -4에서 4까지의 값을 랜덤하게 생성한 것을 확인해 볼 수 있는데요.(좀 더 정확하게 bin 값의 범위입니다.)
# 정규분포의 정의는 평균이 0 분산이 1로 구해지게 됩니다.
# a, c는 1을 빼고 더했기 때문에 평균과 분산이 다르게 나왔는데요.
# b 컬럼은 평균이 0에 가깝고 분산이 1에 가까운 것을 확인해 보실 수 있습니다.
# randn은 rand(랜덤) n(normal) 정규분포값을 생성합니다.
df4.describe()
# 아래의 그래프에서 정규분포값을 평균이 0, 분산이 1에 가까운 분포값을 생성해서 히스토그램을 그렸다고 보시면 됩니다.
df4.plot.hist()
날짜변환 에러
0
259
0
업로드자료 오류
1
373
1
20강 관련 문의드립니다.
1
299
1
17강 도입부 실습사이트 문의
2
298
1
4강 코드 오류메세지 관련 질의
1
374
2
merge와 그룹바이 관련 질문이 있습니다.
1
494
3
쉬운 도서 추천 좀 부탁드립니다.
2
393
2
1강2강에 있는 csv파일을 다운받으면 한글이 깨져서 나와요
1
251
1
주피터노트북 목록(contents) 만들기
1
632
1
df.loc[df["거주지"].isin(gu), "지역"] = df["거주지"] 질문있습니다
1
207
1
월 주 함꼐 value_counts()
1
225
1
day_count.iloc[i]와 day_count[i]의 차이 질문
1
351
1
df 인덱싱 질문입니다
1
184
1
그래프에 한글제목을 나타내고 싶습니다.
1
535
1
배운 것 기반으로 만들어보고 있는데 질문이 있습니다.
1
404
5
질문이요
1
300
1
set_index()
1
287
1
timeit 관련 질문
1
363
1
그래프 밑에 제목을 넣으려면 어떡해야하나요???
1
421
2
한글폰트 설치 후 나오지 않는 현상 문의
1
1173
3
CSV 파일 불러오기
1
573
1
크롤링으로 csv파일 가져오기
2
320
1
영상에서 소개해주시는 웹사이트
2
260
1
질문
1
229
2









