• 카테고리

    질문 & 답변
  • 세부 분야

    데이터 분석

  • 해결 여부

    미해결

선생님 질문있습니다

21.08.13 15:33 작성 조회수 100

1

선생님 데이터 프레임에서 문자열 분리하는 과정에서 선생님은 apply를 활용해서 parse 함수를 적용시켰는데요

저는 그냥 함수에 함수를 담아서 적용할려는데 데이터프레임은 split 속성을 갖지 않는다 라고 오류가 뜨는데 

이런경우는 무조건 apply 함수를 적용시켜야 하나요??

아 그리고 concat으로 데이터프레임을 합칠때 행크기가 달라도 합칠수 있나요?? 제가 알기로는 열크기는 달라도 합칠수 있더라구요

답변 1

답변을 작성해보세요.

1

1) 안녕하세요. 질문주신 내용은 apply를 사용해야 하는데 

파이썬 함수와 판다스 기능이 섞여서 혼란이 있으셨을거 같아요.

판다스에서는 함수를  시리즈나 데이터프레임에 적용해 줄 때 apply를 사용합니다.

시리즈는 map을 사용할 수도 있습니다.

또 문자열에 쓰는 split을 판다스의 시리즈와 데이터프레임에 적용하려면 string accessor라는 것을 사용해야 합니다.

아래와 같은 방법으로 split을 사용할 수 있으며 수업 마지막 주제인 "도시공원 데이터 분석하기"에서 해당 방법을 사용하니 마지막 주제의 강좌를 참고해 주세요.

df["기간"].str.split()

아래 문서도 참고해 보세요.

[Working with text data — pandas 1.3.1 documentation](https://pandas.pydata.org/docs/user_guide/text.html)

2) concat 으로 합칠때는 행, 열 크기 다 달라도 합칠 수 있습니다.

axis=0 일 때는 행을 기준으로 합쳐주는데 컬럼명이 같으면 위 아래로 붙여줍니다.

axis=1 일 때는 컬럼 기준으로 합쳐주는데 인덱스명이 같으면 옆으로 붙여줍니다.

아래 문서를 참고해 보세요.

[Merge, join, concatenate and compare — pandas 1.3.1 documentation](https://pandas.pydata.org/docs/user_guide/merging.html)