cleaning함수를 작성해서 데이터를 추리는 이유는 무엇인가요?
328
작성한 질문수 1
제주지역에 해당하는 데이터만 뽑는 과정을
def cleaning(location):
if location == '제주':
return location
else:
return np.nan로 하셨는데,
raw_log[raw_log['지역(시도)']=='제주'].reset_index(drop=True)
로 하면 안되나요? 혹시 함수를 작성하는 경우가 메모리 상에서 좀 더 효율적인건가요?
답변 1
0
안녕하세요, 인프런 AI 인턴이에요. 데이터를 추리기 위해 cleaning 함수를 작성하는 이유는 다양합니다. 예를 들어, 제주지역에 해당하는 데이터를 추출하는 경우, 함수를 사용하면 코드의 재사용성이 높아질 수 있고, 가독성도 좋아질 수 있습니다. 또한, 함수를 사용하면 추후에 다른 지역에 대해서도 쉽게 적용할 수 있기 때문에 유연성이 높아질 수 있습니다. 함수를 사용하는 것이 메모리 효율 측면에서 더 효율적인지는 함수의 구현에 따라 다를 수 있습니다. 그러나 데이터 프레임에 대해 지역별로 조건을 걸어 추출하는 경우, 함수를 사용하는 것이 일반적으로 좋은 선택입니다. 파이썬에서는 pandas의 조건문을 통해 데이터를 추출할 수 있는데, 이를 함수로 래핑하면 코드의 가독성과 재사용성이 높아집니다. 그렇기 때문에 함수를 작성하는 것이 권장됩니다. 즉, 데이터를 추리기 위한 함수 작성은 코드의 효율성과 가독성을 높이기 위한 방법이라고 할 수 있어요. 필요에 따라 함수로 구현하면 유연하고 효율적인 코드를 작성할 수 있습니다.
그러나 수행 결과에는 차이가 없을 수도 있으니, 개발자의 선호에 따라 적절한 방법을 선택하시면 됩니다. 감사합니다.
기출 11회 작업형 2_전체 데이터 학습 여부
0
13
1
예측값 결과 소수점 차이
0
17
2
기출 문제와 실전챌린지 연습문제 무엇부터 푸는게 나은가요?
0
14
0
전처리 train() test([ ])
0
15
2
작업형 1 배경지식 질문
0
19
2
옳게 풀은건지 질문드립니다!
0
14
1
roc_auc_score
0
22
2
추가질문 합니다
0
16
2
시험환경 구름
0
18
2
2유형 질문드려요
0
15
2
RandomForest vs lgb
0
23
2
21c 버전으로 해도 무방한가요?
0
12
3
전처리 관련질문
0
23
3
작업형3 기출
0
17
2
유형2에서 데이터분할 생략 가능여부
0
28
2
9회 기출 유형3 질문
0
19
2
실습환경 설정부터 맥락을 잘 모르겠습니다ㅠㅠ
0
269
0
명령어에 ()가 있는 경우와 없는 경우
0
219
0
code 관련
0
206
1
강의 csv file
0
326
2
코로나 분석하는데 오류생기네요
0
461
4
안녕하세요
0
225
1
안녕하세요
0
201
1
Numpy 관련 질문 및 교재 오타를 수정해주세요
0
354
1





