작성한 질문수
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2(신 버전)
해결된 질문
작성
·
115
0
해당 문제 연습하는 도중에 train과 test 데이터셋에 총구매액이 0원보다 작은 데이터가 있습니다.
해당 데이터를 0원으로 채우는(변환) 방법을 알고 싶습니다.
결측치의 경우 fillna()로 쉽게 채울 수 있는데 결측치가 아닌 데이터의 조건에 따른 특정값으로 채우는 방법이 궁금합니다
답변 1
어떤 근거로 값을 변경하려는 걸까요? 파생변수는 생성해도 이렇게 값을 임의로 변경하지는 않아요
만약 변경한다면 아래와 같이 사용할 수 있어요
# 예를 들어, 열 'A'의 값이 3보다 큰 경우 열 'B'의 값을 999로 변경 df.loc[df['A'] > 3, 'B'] = 999
해당 데이터셋에서 음수로 표시되는 총구매액은 이상치로 판단되서 이상치를 제거하지 않고 특정값으로 대체하는 방법이 궁금했고, 또 유사한 문제가 1유형에서 나올 수도 있을 거 같아서 질의드렸습니다.
알려주신 방법으로 잘 해결했습니다.
감사합니다.
넵!! 작업형1에선 나올 수 있습니다 🙂
작업형2의 이상치는 문제에서 명시하지 않으면 하지 않는 것을 추천해요~
해당 도메인 전문가가 아닌이상 이유가 있는 데이터 일 수도 있습니다.
해당 데이터셋에서 음수로 표시되는 총구매액은 이상치로 판단되서 이상치를 제거하지 않고 특정값으로 대체하는 방법이 궁금했고, 또 유사한 문제가 1유형에서 나올 수도 있을 거 같아서 질의드렸습니다.
알려주신 방법으로 잘 해결했습니다.
감사합니다.