inflearn logo
강의

Course

Instructor

[2026 Big Data Analysis Certification Practical Exam Preparation] 100% Pass the Big Data Analysis Practical Exam! See the patterns in previous exam questions!

Session 3 Practical Problem 1 Question 2

정규화 질문

87

dbk345727

10 asked

0

정규화 할때

1번

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()

x_train2 = scaler.fit_transform(x_train)

x_test2 = scaler.fit_transform(x_test)

 

2번

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()

scaler.fit(x_train)

x_train2 = scaler.transform(x_train)

x_test2 = scaler.transform(x_test)

 

풀이방식이 1번 2번 둘다 상관 없을 까요 아니면 어떤게 맞는 풀이 일까요?ㅜㅜ

9회 풀이를 보면 표준화는 1번처럼 풀이 됬고

나머지 기출은 2번 처럼 풀이가 됬는데 둘다 해보니 값이 달라서 질문드립니다.

아니면 min_max정규화 standard 표준화 풀이가 다른 것인지도 궁금합니다.

빅데이터 빅데이터분석기사

Answer 2

0

oblige390574

그럼 9호 1번 풀이는 잘못된걸까요?

0

codingkorea

네 ~ 2번 방법이 맞습니다. 이 영상은 수정해두겠습니다.

꼭 2번으로 외워주세요.

감사합니다.

0

codingkorea

네, 답변드립니다.

첫 번째 방법은 데이터 누수 문제가 있습니다.

fit_transform(x_train)과 fit_transform(x_test)를 각각 실행하면 훈련 데이터와 테스트 데이터가 서로 다른 스케일링 기준으로 변환됩니다.

이는 모델 성능을 부정확하게 평가하게 만듭니다.

두 번째 방법이 올바른 방법입니다:

오직 훈련 데이터로만 스케일링 기준을 학습합니다 (fit)

같은 기준으로 훈련 데이터와 테스트 데이터를 모두 변환합니다 (transform)

반드시 두 번째 방법을 사용하세요. 훈련 데이터로만 스케일러를 학습하고, 같은 스케일러로

모든 데이터를 변환해야 합니다.

0

dbk345727

감사합니다!!!

수강 기한 연장 문의

0

74

4

코랩 기본 사용법 문의

0

63

1

8회 작업형1 문제2

0

59

2

4회 2유형 1번 문제

0

48

1

다중 선형 회귀 상수항 추가 관련 질문

0

88

2

10회 작업형1번문제2번 문제 풀이 틀림

0

74

2

8회 1유형 1번 문제

0

73

1

답변 항상 감사드립니다. 질문 있습니다.

0

68

2

원핫인코딩 이후 칼럼 불일치 문제

0

66

2

6회 1유형 3번 문제

0

63

1

코딩 방법에 따른 채점 기준에 관하여 질문있습니다.

0

77

1

데이터 파일들은 어디서 다운받을 수 있나요?

0

79

2

선형회귀분석 질문

0

47

2

링크가안보여요 어디에올라와있는거죠대체 ? 구글코랩파일이요

0

82

4

범주형 인코딩

0

83

2

원핫인코딩시 라벨링질문

0

78

1

인코딩 질문!!

0

72

1

유형2 질문!!

0

58

2

6회 작업형 2 문제 1

0

61

1

작업형 유형 2에서,,, train, test, split 시 성능

0

122

2

항상 모델학습하실때 train_test_split일부러 안하시는 이유가 있는건가요?

0

94

2

Label Encoding 관련 질문

0

99

3

상수항 질문드립니다. (6회 작업형 2문제)

0

49

1

2유형 답안 제출 시 문의

0

59

1