강의

멘토링

커뮤니티

Cộng đồng Hỏi & Đáp của Inflearn

Hình ảnh hồ sơ của esh20194508
esh20194508

câu hỏi đã được viết

Chuẩn bị kỹ năng thực hành làm kỹ sư phân tích dữ liệu lớn (sử dụng R)

출제예상 문제 질문이요~

Viết

·

193

·

Đã chỉnh sửa

0

안녕하세요

 

오늘부터 빅분기 실기 R강의수강을 시작한 학생입니다.

 

강의를 듣던 중 궁금한 점이 있어서요

 

출제예상 문제중에서

아래 표시를 해두었는데요

 

데이터를 불러올때 왜 1부터 150행까지만 불러오는 것일까요?

 

airquality 데이터 전체를 df으로 불러오는건 안되는건가요?

 

 

 

# 2. 첫 행부터 상위 80%개의 행을 추출하고 Ozone변수의 결측값을 Ozone변수의 중앙값으로 대체하고

# 대체전과 후의 표준편차 값의 차이

df <- airquality[c(1:150),] ------------------------------> 이부분이 궁금해요!

str(df)

val <- nrow(df)*0.8

df1 <- df[c(1:val),]

str(df1)

df1$Ozone_comp <- ifelse(is.na(df1$Ozone), median(df1$Ozone, na.rm = T), df1$Ozone)

summary(df1)

sd(df1$Ozone, na.rm = T) - sd(df1$Ozone_comp, na.rm = T)

result <- sd(df1$Ozone, na.rm = T) - sd(df1$Ozone_comp, na.rm = T)

print(result)

 

빅데이터

Câu trả lời 1

0

companionclub님의 프로필 이미지
companionclub
Người chia sẻ kiến thức

 

안녕하세요. 답변드립니다.

위의 코드는 특별한 의미는 없습니다.

 

당시 시험에 그 정도의 숫자의 데이터 프레임과 80%만 취하는 문제가 출제되어서 그렇습니다.

airquailty의 전체 row수의 80%가 정수로 떨어지지 않아서,

인위적으로 숫자를 유사하게 조정한 것일 뿐 특별한 의미는 없습니다.

 

그 점 참고부탁드립니다.

Hình ảnh hồ sơ của esh20194508
esh20194508

câu hỏi đã được viết

Đặt câu hỏi