cleaning함수를 작성해서 데이터를 추리는 이유는 무엇인가요?
321
1 asked
제주지역에 해당하는 데이터만 뽑는 과정을
def cleaning(location):
if location == '제주':
return location
else:
return np.nan로 하셨는데,
raw_log[raw_log['지역(시도)']=='제주'].reset_index(drop=True)
로 하면 안되나요? 혹시 함수를 작성하는 경우가 메모리 상에서 좀 더 효율적인건가요?
Answer 1
0
안녕하세요, 인프런 AI 인턴이에요. 데이터를 추리기 위해 cleaning 함수를 작성하는 이유는 다양합니다. 예를 들어, 제주지역에 해당하는 데이터를 추출하는 경우, 함수를 사용하면 코드의 재사용성이 높아질 수 있고, 가독성도 좋아질 수 있습니다. 또한, 함수를 사용하면 추후에 다른 지역에 대해서도 쉽게 적용할 수 있기 때문에 유연성이 높아질 수 있습니다. 함수를 사용하는 것이 메모리 효율 측면에서 더 효율적인지는 함수의 구현에 따라 다를 수 있습니다. 그러나 데이터 프레임에 대해 지역별로 조건을 걸어 추출하는 경우, 함수를 사용하는 것이 일반적으로 좋은 선택입니다. 파이썬에서는 pandas의 조건문을 통해 데이터를 추출할 수 있는데, 이를 함수로 래핑하면 코드의 가독성과 재사용성이 높아집니다. 그렇기 때문에 함수를 작성하는 것이 권장됩니다. 즉, 데이터를 추리기 위한 함수 작성은 코드의 효율성과 가독성을 높이기 위한 방법이라고 할 수 있어요. 필요에 따라 함수로 구현하면 유연하고 효율적인 코드를 작성할 수 있습니다.
그러나 수행 결과에는 차이가 없을 수도 있으니, 개발자의 선호에 따라 적절한 방법을 선택하시면 됩니다. 감사합니다.
작업형1 - 연습문제 1번 관련 질문입니다.
0
17
2
38번 문제 보기 3,4번
1
13
3
14번 문제
1
22
2
강의 자료 16~39 관련
0
28
2
데이터 전처리 시 문의
0
37
2
random_state 값
0
31
2
인코딩 사용여부
0
34
2
인코딩 전 데이터 합치기 질문드립니다!
0
33
1
모바일 앱 쿠폰
0
29
1
섹션5. 회귀 강의 관련 질문드립니다
0
40
2
dvdrental 서버에 접속할 수 없어요
0
29
1
수강기간연장 문의드립니다
0
44
2
수강 연장 문의
0
44
2
label 인코딩 에러 발생 원인
0
41
2
astro dev init 에 Dockerfile 버전 고정 방법 문의
0
24
2
속성 핵집문제 2번
1
36
2
실습환경 설정부터 맥락을 잘 모르겠습니다ㅠㅠ
0
266
0
명령어에 ()가 있는 경우와 없는 경우
0
214
0
code 관련
0
205
1
강의 csv file
0
318
2
코로나 분석하는데 오류생기네요
0
460
4
안녕하세요
0
222
1
안녕하세요
0
195
1
Numpy 관련 질문 및 교재 오타를 수정해주세요
0
352
1

