로그변환에 대하여
646
작성한 질문수 7
안녕하세요.
로그변환에 대하여 궁금한게 있어 질문 남겨봅니다.
로그 변환을 한 데이터들이 모델이 학습해서 예측하기 좋아서 변환 시켜주는건가요? 로그변환을 안한 데이터를 학습하는거랑 accuracy/precision/f1 score등 차이가 나는지 궁금합니다.
또한 입력특성의 로그변환은 왜 하는지 궁금합니다. 다른 variable들은 로그변환 고려를 안하는건가요? (지하실면적 제외). 아니면 Trial and error을 통해 로그변환 하나씩 시켜보는게 더 효과적인건가요?
답변 1
1
안녕하세요.
어떤 변수들은 로그변환한 값을 사용해야 성능이 좋아집니다. (분류 및 예측 모두).
로그변환의 대상이 되는 데이터는 금전에 관한 것, 생물학적 반응에 관한 것 등입니다. 귀로듣는 사운드의 경우도 로그변환이 필요합니다.
로그변환을 하는 이유는 입력과 출력의 관계가 선형적이 되서 "설명"을 더 잘 할 수 있기 때문입니다.
지하실 면적처럼 면적이 크다고 면적에 비례해서 집 값이 올라가는 것이 아니라 큰 값을 약화시키는 것이 더 모델의 성능을 개선시키는 사례도 있습니다. 이러한 사례는 경험과 시행착오로 찾는 것입니다. (데이터의 확률 분포를 보고 가능한 정규 분포 모양을 따르는지 보고 관찰합니다..
멍슨상이라 이름 변경하시는 게 어떠신지요?
1
12
0
수업 노트가 안 보입니다.
0
14
1
Python formatter 설치
0
11
1
55강 파이썬에만있는 연산자들
0
10
1
55강의 파이썬에서만 있는 연산자들
0
9
1
주말에 실행할 경우 update_economic_data_in_background에 로직 변경 필요성
1
17
1
naver 글자 수집 오류 건
0
14
1
쥬피터 노트북이 실행이 안됩니다.
0
17
1
뒤로가기 버튼 같은 것이 있나요?
0
21
1
Replit 강의 자료가 안나와요
0
16
1
강의 연장 문의
0
18
1
프로그램 실행시간에 대한 질문
1
20
2
비중 및 매수 종목수 조정.
1
22
2
Claude api가 소식 동기화가 늦는 문제
1
35
2
[긴급요청2] 28강 동영상 오류(27강 음성 재생) 수정 예정일자를 알려주세요
0
22
1
codex에게 대용량 코드베이스를 인식 시키는 방법은 어떤게 있나요?
0
29
1
결측값 처리
0
576
1
n_step 값에 대하여
0
453
1
dir*.csv가 안됩니다.
0
329
1
6 시그마 이상 outlier
0
558
1
In[42] 14:50 코드 질문
0
249
1
Titanic 데이터셋 PClass cateogrical -> one hot encoding
0
385
1
표준 스케일링관련 문의
0
320
1
6:14초 dataframe 스케일링한 후 컬럼 추가에 대한 질문
0
741
1





