Id 삭제
4
작성한 질문수 1
에어비엔비 가격 데이터에서 ID는 왜 삭제하는건가요? 꼭 삭제해야하는 건가요?
여기 답변달린거 보니까 숫자인 경우에는 ID 삭제 안해도 된다고 하던데 ID가 숫자인데 왜 삭제하는 건가요?
+) AI 답변 확인했는데, 맨 처음 전처리를 할 때 ID를 삭제할지 안할지를 어떻게 판단하는지 기준을 알고싶어요.
답변 1
0
안녕하세요, 인프런 AI 인턴입니다. aa님.
ID 컬럼을 삭제하는 이유는 주로 머신러닝 모델의 학습에 영향을 주지 않기 위함입니다. ID 값은 각 데이터 포인트를 고유하게 지정하기 위한 것으로, 실제로 데이터 분석이나 예측 모델링에 필요한 유의미한 정보를 제공하지 않습니다. 따라서, 대부분의 경우 ID 컬럼은 학습 과정에서 불필요한 변수로 간주되며, 모델의 성능을 방해하지 않도록 제거하는 것이 일반적입니다.
ID 컬럼이 숫자형이라고 하더라도 각 데이터의 식별 목적으로만 사용된다면 모델이 이 컬럼을 데이터의 구조적 정보로 판단하여 불필요한 복잡도를 증가시킬 수 있습니다. 따라서 숫자 ID일지라도 학습 성능에 도움이 되지 않는다면 제거하는 것이 좋습니다. 다만, 데이터를 분석하거나 모델에서의 중요도 평가를 통해 ID 컬럼이 중요한 역할을 하지 않은 것을 확인한다면 삭제하지 않아도 됩니다.
이에 대한 더 많은 논의를 이 링크와 추가 학습에서 확인하실 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
roc_auc_score 질문: 작업형2 모의문제3 09분 48초
0
6
1
원핫인코딩 코드 질문
0
10
1
map 함수 사용 필수적인가요
0
15
1
수강 기한 연장 문의드립니다.
0
17
1
34강 평가지표
0
22
2
103강 작업2형 전처리(레이블인코딩 부분) 오류
0
14
2
작업형1_section14 문의
0
13
2
작업형1_연습문제 7번 관련입니다.
0
15
2
데이터 프레임 슬라이싱 혹은 데이터 선택하기가 어렵습니다.
0
13
2
크로스 밸리데이션 질문
0
20
2
로지스틱 회귀분석 질문
0
16
2
수치형 데이터만 선택하여 푸는 경우에 오답확률이 높아질까요?
0
24
2
2유형 object 컬럼 인코딩 관련 질문
0
34
2
하이퍼파라미터 변수
0
29
2
52강 이원분산분석
0
26
2
실제시험환경에서 작업형1,2,3의 문제풀이 순서
0
33
2
독립표본검정
0
26
2
tranform을 쓰라는 힌트는 어디서 얻을 수 있나요??
0
38
2
df.describe() 사용을 자제해야할까요?
0
38
2
shape 결과에 대한 문의
0
39
2
자료 문의
0
31
2
8 회귀 11번
0
29
2
심화 강의 관련 질문
0
39
2
빈도수 구하는 것 질문
0
26
2





