결측치 질문
10회 작업형2
타겟 변수(총가스사용량)는 일부 값이 0으로 기재되어 있으며, 이는 결측치를 대체한 값임.
관련하여
두번째 방법인
target=target[~cond] 로 했을때
오류가 줄어들어 더 좋은 값이면
이걸로 하는게 더 좋은건가요?
보통 결측치가 있을때는
그럼 결측치를 다른 값으로 대체하거나, 그렇게 하라고 문제에서 주어지나요?
그럼 fillna()로 사용해서 넣는건가요?
답변 2
0
안녕하세요, 인프런 AI 인턴입니다. 합격님이 결측치 처리에 대해 질문을 주셨네요.
결측치 처리의 경우, 데이터 분석에서는 중요한 문제로, 주어진 상황과 목표에 따라 다양한 접근 방법이 필요할 수 있습니다.
결측치 처리 방법
‘gas_totl(taeget)‘의 결측치를 0으로 대체: 이는 일반적으로 결측치가 분석에 심각한 영향을 미치지 않는다는 가정 하에, 단순히 0으로 대체하는 방법입니다. 이는 실제로 결측치의 의미가 0에 가깝다고 판단될 때 주로 사용됩니다.
target=target[~cond] 방법: 이 방식은 특정 조건을 사용하여 데이터의 행이나 열을 제거하는 것이므로 데이터의 구조와 모양이 변경될 수 있습니다. 모델의 성능이 개선되는 경우 이 방식을 선택할 수 있지만, 데이터가 손실될 수 있으므로 조심해야 합니다.
결측치 대체 시 fillna() 사용:
fillna()는 결측치를 특정 값으로 대체할 때 사용됩니다. 예를 들어 평균, 중앙값, 최빈값 등으로 대체할 수 있습니다.
문제의 경향이나 요구 사항에 따라서도 결측치 처리 방법이 달라질 수 있기 때문에 문제에서 명시한 방법론을 따르는 것이 좋습니다. 시험에서는 주로 문제에서 지정한 방법을 사용하는 것이 안전합니다.
아래 링크들이 결측치 관련 과정에 대해 좀 더 이해를 도와줄 수 있을 것 같습니다.
- 결측값 처리 관련 궁금합니다: fillna()와 관련된 질문
- 데이터 전처리 작업시 조건에 따른 특정값 채우는 방법?: 조건에 따른 데이터 대체 방법에 대한 질문
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적인 질문이 있으시면 계속해서 문의해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
작업형 1 배경지식 질문
0
1
1
옳게 풀은건지 질문드립니다!
0
2
0
roc_auc_score
0
4
1
추가질문 합니다
0
11
1
시험환경 구름
0
11
1
2유형 질문드려요
0
8
1
RandomForest vs lgb
0
18
1
전처리 관련질문
0
13
2
작업형3 기출
0
13
1
유형2에서 데이터분할 생략 가능여부
0
20
2
9회 기출 유형3 질문
0
15
1
lgb 기초편
0
10
1
괄호 사용
0
15
1
작업형 2 데이터 전처리 질문
0
18
1
11회 기출 유형 작업형1 문제 3-1
0
16
0
예시문제 작업형2 (ver2023) 질문입니다
0
16
1
Data type에 따른 처리
0
15
2
데이터 전처리 관련
0
16
2
시험에서 문제 불러오기
0
18
2
2번문제 출력값 질문
0
23
2
pd.get_dummies()가 bool로 반환
0
18
2
대응표본검정 레빈
0
23
3
단일표본검정 문제 유형
0
23
2
[작업형 3] 6~7. 카이제곱 검정
0
23
2





