데이터 전처리 작업시 조건에 따른 특정값 채우는 방법?
해당 문제 연습하는 도중에 train과 test 데이터셋에 총구매액이 0원보다 작은 데이터가 있습니다.
해당 데이터를 0원으로 채우는(변환) 방법을 알고 싶습니다.
결측치의 경우 fillna()로 쉽게 채울 수 있는데 결측치가 아닌 데이터의 조건에 따른 특정값으로 채우는 방법이 궁금합니다

답변 1
0
어떤 근거로 값을 변경하려는 걸까요? 파생변수는 생성해도 이렇게 값을 임의로 변경하지는 않아요
만약 변경한다면 아래와 같이 사용할 수 있어요
# 예를 들어, 열 'A'의 값이 3보다 큰 경우 열 'B'의 값을 999로 변경
df.loc[df['A'] > 3, 'B'] = 999
0
해당 데이터셋에서 음수로 표시되는 총구매액은 이상치로 판단되서 이상치를 제거하지 않고 특정값으로 대체하는 방법이 궁금했고, 또 유사한 문제가 1유형에서 나올 수도 있을 거 같아서 질의드렸습니다.
알려주신 방법으로 잘 해결했습니다.
감사합니다.
0
넵!! 작업형1에선 나올 수 있습니다 🙂
작업형2의 이상치는 문제에서 명시하지 않으면 하지 않는 것을 추천해요~
해당 도메인 전문가가 아닌이상 이유가 있는 데이터 일 수도 있습니다.
질문 드립니다.
0
36
2
강의 내용 관련 질문드립니다~
0
34
2
수강 연장 문의
0
31
1
강의자료 일괄 다운로드
0
40
2
수강기간 연장 문의드립니다
0
27
1
list 문제 질문드립니다~
0
28
2
빅분기 실기 12회 재도전
0
39
1
강의 기간 연장 가능여부 검토 요청건
0
30
1
수강기간 연장 문의 드립니다
0
36
2
수강기간 연장 문의드립니다
0
46
2
질문이요
0
50
2
수강기간 연장 문의드립니다.
0
48
2
문제 3-2 질문드립니다
0
43
2
수강기간 연장 문의 드립니다.
0
57
2
변수, 칼럼 , df 구분
0
47
2
수강기간 연장 문의드립니다.
0
49
2
수강기간 연장 문의
0
46
2
수강기간 연장 문의드립니다.
0
40
2
수강기한 연장 문의
0
75
2
수강기간 연장 문의드립니다
0
57
2
결정트리에서 적절한 깊이 선택 후 시각화 과정에서 학습 데이터만 사용하는 이유
0
44
2
수강기간 연장 문의드립니다.
0
69
2
수강연장 문의
0
76
2
수강연장문의
0
53
2





