inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(회귀)

로그 스케일 질문

해결된 질문

262

현지원

작성한 질문수 14

0

안녕하세요 🙂

 

MinMax, Standard 스케일링은 train, test 다 적용해줬는데

로그 스케일을 진행할 때는 train 데이터에만 적용해야 하는건가요?

스크린샷 2024-06-16 오후 2.36.40.png

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 2

0

퇴근후딴짓

로그스케일을 적용한 charges은 타겟입니다.

타켓은 test에는 없습니다.

로그스케일은 적용하고, 예측후에 다시 복원까지 필요한 복잡한 단계가 있어요

혹시 작업형2을 이제 학습중이라면 로그스케일은 패스해주세요! 심화 내용입니다.

 

0

인프런 AI 인턴

안녕하세요, 인프런 AI 인턴입니다. 현지원님의 질문에 대해 특정 강의 내용을 기반으로 한 답변이 있어 해당 내용을 공유드리겠습니다.

로그 스케일링 및 다른 스케일링 방식들을 적용하는 방법과 타깃 변수에만 로그 변환을 적용하는 것의 적절성에 대한 구체적인 답변은 “3-6 Regression 강의 관련 질문”에서 확인하실 수 있습니다. 이 답변에서는 로그 스케일링을 특정 컬럼(예: charges)에만 적용하는 이유와 전체 컬럼에 적용하지 않는 경우의 배경에 대해 설명하고 있습니다.

로그 스케일의 주요 목적은 데이터의 분포가 크게 왜곡되어 있거나 예측의 정확도를 향상시키기 위해 사용됩니다. 특히, 타겟 변수에 로그 변환을 적용하는 경우는 예측 모델의 성능을 개선하기 위해 자주 사용되는 전략 중 하나입니다. 로그 변환 후, 모델 예측값에는 역변환 과정이 필요할 수 있는데, 이 과정 역시 해당 답변에서 다뤄지고 있습니다.
질문에서 언급된 것처럼, 로그 변환을 타겟 변수에만 적용하는 이유는 적용 예시와 같이 해당 변수의 분포가 불균형하거나 예측에 있어서 보다 선형적인 관계를 형성하기 위함입니다. 그러나 이 변환을 적용한 후 모델 학습에 사용된다면, 예측 결과를 해석할 때 역변환 과정을 통해 원래 스케일로 돌리는 과정이 추가적으로 필요함을 유념해야 합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

7회 기출문제 작업형1번 df 변환 후 저장되는 방식 질문

0

8

1

3 유형 귀무가설, 대립가설

0

12

2

인코딩 관련 질문 있습니다

0

16

2

작업형3 이원분산분석 sm에서불러오기 / anova_lm 차이

0

13

2

2유형 원핫인코딩 오류

0

16

2

시험장에서 주석 단축키 안될 때 많나요?

0

24

2

라벨인코딩 방식

0

21

2

test 재학습 관련

0

14

2

target 빈도 확인

0

16

2

작업형 2 연습문제 섹션 6

0

19

2

F1-score

0

17

2

작업형 2번 섹션 3

0

15

2

작업형 2 인코딩, 결측치, 모델 선택 질문

0

19

1

인코딩 방식 문의

0

24

2

9회 3유형 ==> 7회 3유형 질문드려요

0

15

2

작업형 2관련 질문입니다

0

13

2

작업형2 카테고리

0

24

2

110강 회귀_8번 문의

0

16

2

XGBRegressor 학습 시 warning 출력

0

21

2

데이터 프레임을 변경해도 되나요?

0

17

2

10회 기출 작업형3 문제 2-1 질문

0

24

2

작업형 2 질문

0

25

2

작업형 2 템플릿 확인 요청

0

27

2

작업형2 인코딩 질문

0

28

2