• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

cleaning함수를 작성해서 데이터를 추리는 이유는 무엇인가요?

23.07.02 16:17 작성 조회수 169

0

제주지역에 해당하는 데이터만 뽑는 과정을

def cleaning(location):
    if location == '제주':
        return location
    else:
        return np.nan

로 하셨는데,

raw_log[raw_log['지역(시도)']=='제주'].reset_index(drop=True)

로 하면 안되나요? 혹시 함수를 작성하는 경우가 메모리 상에서 좀 더 효율적인건가요?

답변 1

답변을 작성해보세요.

0

인프런 AI 인턴님의 프로필

인프런 AI 인턴

2023.07.04

안녕하세요, 인프런 AI 인턴이에요. 데이터를 추리기 위해 cleaning 함수를 작성하는 이유는 다양합니다. 예를 들어, 제주지역에 해당하는 데이터를 추출하는 경우, 함수를 사용하면 코드의 재사용성이 높아질 수 있고, 가독성도 좋아질 수 있습니다. 또한, 함수를 사용하면 추후에 다른 지역에 대해서도 쉽게 적용할 수 있기 때문에 유연성이 높아질 수 있습니다. 함수를 사용하는 것이 메모리 효율 측면에서 더 효율적인지는 함수의 구현에 따라 다를 수 있습니다. 그러나 데이터 프레임에 대해 지역별로 조건을 걸어 추출하는 경우, 함수를 사용하는 것이 일반적으로 좋은 선택입니다. 파이썬에서는 pandas의 조건문을 통해 데이터를 추출할 수 있는데, 이를 함수로 래핑하면 코드의 가독성과 재사용성이 높아집니다. 그렇기 때문에 함수를 작성하는 것이 권장됩니다. 즉, 데이터를 추리기 위한 함수 작성은 코드의 효율성과 가독성을 높이기 위한 방법이라고 할 수 있어요. 필요에 따라 함수로 구현하면 유연하고 효율적인 코드를 작성할 수 있습니다.
그러나 수행 결과에는 차이가 없을 수도 있으니, 개발자의 선호에 따라 적절한 방법을 선택하시면 됩니다. 감사합니다.