강의

멘토링

로드맵

Inflearn brand logo image

인프런 커뮤니티 질문&답변

이선희님의 프로필 이미지
이선희

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

데이터 전처리2 (인코딩, 스케일링)

minmax_sclaer와 MinMaxScaler의 차이?

해결된 질문

작성

·

49

0

from sklearn.preprocessing import minmax_scale

--> 이 방법은 1유형

from sklearn.preprocessing import MinMaxSclaer

--> 이 방법은 2유형

 

원래는 위에 코드만 외워야겠다 생각했는데 강의를 들어보니 아래코드도 숙지해야할거같은데

유형에 따라 저렇게 활용해야하는게 맞을까요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네, 맞습니다.
하나만 외운다면 아래 함수를 꼭 기억해 주세요.
이 함수는 2유형뿐만 아니라 1유형에서도 사용 가능하지만,
작업형2에서는 사용이 어렵습니다.

0

안녕하세요, 인프런 AI 인턴입니다.

이선희님, 두 가지 라이브러리 함수인 minmax_scaleMinMaxScaler에 대한 차이점을 이해하는 것이 중요합니다. 이는 데이터 스케일링 측면에서 각각의 활용 방법이 다릅니다.

  1. minmax_scale:

    • 이 함수는 간단하게 사용하기 쉬운 방법으로, 한 번의 함수 호출로 데이터를 바로 스케일링할 수 있습니다. 주로 작고 간단한 데이터셋에 바로 스케일링을 적용할 때 유용합니다.
    • 예제:
      
      from sklearn.preprocessing import minmax_scale
      data_scaled = minmax_scale(data)
      

  2. MinMaxScaler:

    • 반면에 MinMaxScaler는 객체를 생성하고 이 객체에 대해 fittransform 메서드를 호출하여 스케일링을 수행합니다. 이 방법은 훈련 데이터와 테스트 데이터가 분리된 상황에서 사용할 때 적합합니다.
    • 예제:
      
      from sklearn.preprocessing import MinMaxScaler
      scaler = MinMaxScaler()
      data_scaled_train = scaler.fit_transform(train_data)
      data_scaled_test = scaler.transform(test_data)
      

MinMaxScaler는 데이터셋의 분할(예: Train/Test)에서 각각의 데이터셋에 같은 스케일링을 일관되게 적용해야 할 때 유용합니다.

관련 질문은 아래 링크에서 확인할 수 있습니다:

이러한 구체적인 스케일링 전략은 데이터의 구조와 문제의 유형에 따라 달라질 수 있으니, 강의 내용을 참고하시어 적절한 방법을 적용하시기 바랍니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

이선희님의 프로필 이미지
이선희

작성한 질문수

질문하기