데이터 전처리 작업시 조건에 따른 특정값 채우는 방법?
해당 문제 연습하는 도중에 train과 test 데이터셋에 총구매액이 0원보다 작은 데이터가 있습니다.
해당 데이터를 0원으로 채우는(변환) 방법을 알고 싶습니다.
결측치의 경우 fillna()로 쉽게 채울 수 있는데 결측치가 아닌 데이터의 조건에 따른 특정값으로 채우는 방법이 궁금합니다

답변 1
0
어떤 근거로 값을 변경하려는 걸까요? 파생변수는 생성해도 이렇게 값을 임의로 변경하지는 않아요
만약 변경한다면 아래와 같이 사용할 수 있어요
# 예를 들어, 열 'A'의 값이 3보다 큰 경우 열 'B'의 값을 999로 변경
df.loc[df['A'] > 3, 'B'] = 999
0
해당 데이터셋에서 음수로 표시되는 총구매액은 이상치로 판단되서 이상치를 제거하지 않고 특정값으로 대체하는 방법이 궁금했고, 또 유사한 문제가 1유형에서 나올 수도 있을 거 같아서 질의드렸습니다.
알려주신 방법으로 잘 해결했습니다.
감사합니다.
0
넵!! 작업형1에선 나올 수 있습니다 🙂
작업형2의 이상치는 문제에서 명시하지 않으면 하지 않는 것을 추천해요~
해당 도메인 전문가가 아닌이상 이유가 있는 데이터 일 수도 있습니다.
괄호 사용
0
2
1
작업형 2 데이터 전처리 질문
0
5
0
11회 기출 유형 작업형1 문제 3-1
0
5
0
예시문제 작업형2 (ver2023) 질문입니다
0
8
1
Data type에 따른 처리
0
5
1
데이터 전처리 관련
0
12
2
시험에서 문제 불러오기
0
11
2
2번문제 출력값 질문
0
15
2
pd.get_dummies()가 bool로 반환
0
16
2
대응표본검정 레빈
0
18
3
단일표본검정 문제 유형
0
18
2
[작업형 3] 6~7. 카이제곱 검정
0
16
2
9회 작업형3 문제 1-1
0
29
2
최종답안 계산 방식 질문
0
18
1
시험 치기 전 급하게 질문 사항
0
30
2
유형3
0
28
2
작업형 2 연습문제 섹션 3
0
19
2
11 기출문제 ipynb파일
0
32
2
작업형 3 유형
0
26
2
11회 기출 유형(작업형1) 2번 정답
0
27
2
f1 score 질문
0
21
2
10회 작업형 2 인코딩 질의
0
19
2
53번 강의에서 갑자기 수업노트가 없어졌습니다.
0
26
2
28:19 roc_auc이유
0
25
2





