inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

판다스 람다식 적용하여 데이터 가공하기

apply를 이용하지 않을경우

221

thwnsdyd

작성한 질문수 3

0

apply를 이용하지 않는경우는 어떻게 하는지 모르겠습니다 밑의 코드처럼 작성하면 되는데 다른 방법이있나요

list1 = []
for i in titanic_df['Name']:
    list1.append(len(i))

titanic_df['len_name'] = list1
titanic_df

머신러닝 배워볼래요? python 통계

답변 3

0

권 철민

아, 그러셨군요.  새해 복많이 받으시고, 내년에도 건승하시기를 기원드립니다.

0

thwnsdyd

제가 따로 공부를 하고싶어서 여쭤봤습니다 apply를 사용하면 코드실행시간이 길어진다고하더라구요 혹시 다른 방법있다면 알려주실수있나했습니다 새해복많이받으시고 감사합니다~

0

권 철민

안녕하십니까,

일단 제가 질문의 맥락을 잘 모르겠습니다.

굳이 apply를 이용하지 않아야 되는 이유가 있어서 그러신건지요?

아님, 해당 로직을 apply를 이용하지 않고 다른 방법으로 풀어보고 싶으신 건지요?

apply를 이용하는 경우는 row단위로 비교적 가공해야할 로직이 좀 복잡할 때 사용합니다. 일반적으로 pandas는 컬럼단위의 연산을 선호합니다(넘파이 기반이라 컬럼 단위 연산이 매우 빠릅니다). 그런데 이렇게 컬럼 단위의 가공이 여의치 않은 경우에 apply를 적용합니다.

apply를 적용하지 않고 가공하는 경우, 위에 적어주신 것 같이 적용하는 방법도 있을 것이고, apply가 어떤 형태로 적용되었느냐에 따라 여러가지 다른 방법도 있을 것입니다.

하지만 적어주신대로 개별 row 단위로 iteration을 하면서 가공된 값을 하나의 collection(여기서는 list)로 저장한 뒤 이를 컬럼 단위로 변환 하는 방법이 일반적인 방법 같아 보입니다.

감사합니다.

안녕하세요 열심히 수강중인 학생입니다

0

60

2

정수 인덱싱

0

68

2

넘파이 오류

0

83

2

11강 numpy의 axis 축 질문 드립니다.

0

85

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

77

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

69

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

75

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

64

2

5강 강의 오류가 있어요.

0

83

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

72

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

69

3

파이썬 다운그레이 후 사이킷런 재설치

0

116

2

좋은 강의 감사합니다.

0

72

2

scoring 함수 음수값

0

67

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

99

2

분류 평가 정확도 예측

0

76

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

98

1

카카오톡 채널 있나요

0

106

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

189

2

pca 스케일링 관련하여 질문드립니다.

0

100

2

주피터 대신 구글 코랩

0

171

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

146

2

실루엣 스코어..

0

84

2

float64 null 값 처리 방법

0

102

2