inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

캐글 T2-2 질문드립니다!!

해결된 질문

233

김석종

작성한 질문수 13

0

# 포도당을 제외한 이상치, 평균값으로 대체

cols = ['BloodPressure', 'SkinThickness', 'Insulin', 'BMI']

cols_mean = X_train[cols].mean()

X_train[cols] = X_train[cols].replace(0, cols_mean)

선생님께서는 이렇게 train 데이터의 결측치만 평균값으로 바꿔주셨는데 X_test도 같이 바꿔줘야 하는게 아닌가 해서 질문드렸습니다. 그리고 만약 바꾸어 주는게 맞다고 하면 밑에 있는 코딩처럼 다시 한번 X_test[cols]값들의 평균을 구한 다음 하는건지 아니면 위에 있는 train 데이터의 cols_mean을 사용하는건지 궁금합니다!!

# cols_mean = X_test[cols].mean()

# X_test[cols] = X_test[cols].replace(0, cols_mean)

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

0

퇴근후딴짓

안녕하세요! 우선 인프런 자료는 계속해서 업데이트 하고 있지만
캐글 자료는 우선순위가 뒤에 있어 업데이트를 못하고 있습니다. 🙌

우선 테스트에서도 0 값이 있는지 확인을 해 볼 필요가 있을 것 같아요.
만약 채운다면 test에도 train의 평균값을 채우는 것이 맞는데
시험에서 test 평균값을 사용하지 말라는 말이 없다면 test의 평균값을 사용해도 될 것 같아요:)

1

김석종

네 감사합니다 선생님!

 

0

퇴근후딴짓

네 화이팅 입니다 💪💪💪

작업형 2 기출7회분에서

0

3

1

작업형2 모의문제1 (30강)

0

21

2

수강 기간 연장 문의 드립니다.

0

26

2

수강 계획과 관련해 문의 드립니다.

0

24

2

작업형1 - 연습문제 16~39 풀이는 몇강을 보면 되나요?

0

47

2

작업형 1 -연습문제 4-6

0

34

2

작업형 1 유형 부분

0

41

2

작업형 1 (삭제예정, 구 버전)

0

51

2

수강기간 연장 문의드립니다.

0

37

2

2유형 레이블 인코딩 VS 원핫 인코딩

0

36

3

수강기간 연장 문의드립니다.

0

42

2

인덱스 슬라이싱

0

36

2

질문 드립니다.

0

50

2

강의 내용 관련 질문드립니다~

0

46

2

수강 연장 문의

0

63

2

강의자료 일괄 다운로드

0

58

2

수강기간 연장 문의드립니다

0

48

2

list 문제 질문드립니다~

0

38

2

빅분기 실기 12회 재도전

0

63

2

강의 기간 연장 가능여부 검토 요청건

0

50

2

수강기간 연장 문의 드립니다

0

46

2

수강기간 연장 문의드립니다

0

52

2

질문이요

0

57

2

수강기간 연장 문의드립니다.

0

60

2