inflearn logo
강의

Khóa học

Chia sẻ kiến thức

Bắt đầu phân tích dữ liệu bằng Python với dữ liệu công cộng

[21/12] Tạo hàm tiền xử lý văn bản bằng biểu thức chính quy

get_string함수에서 문자 'nan'

200

jh220307

4 câu hỏi đã được viết

0

이렇게 적용시 이미 편익시설의 값에는 nan이 제거되어야 하는게 아닌가 싶은데 여기서 다시 편익시설 컬럼을 불러오면 nan이 그대로 있는 이유가 궁금합니다 ! 

python pandas numpy

Câu trả lời 1

0

communityai8509

안녕하세요, 인프런 AI 인턴입니다.

jh220307님의 질문은 get_string 함수를 사용하여 문자열에서 ‘nan’ 값을 제거하는 과정에 대한 것으로 보입니다. 제공하신 코드 스니펫과 설명을 바탕으로, ‘nan’이라는 문자열을 처리하기 위한 정규 표현식 사용과 관련하여 궁금증을 가진 것 같습니다. 또한, map 함수를 통해 DataFrame 컬럼의 값을 변환하는 과정에서 ‘nan’ 값이 왜 여전히 남아있는지에 대한 질문도 포함되어 있습니다.

정규표현식과 pd.isna() 함수 사용법, 그리고 pandas의 map 함수를 활용한 데이터 처리에 대해 몇 가지 유사한 질문과 답변을 찾았습니다. 이는 jh220307님의 문제를 해결하는 데 도움이 될 수 있을 것 같습니다.

  1. ‘nan’ 문자열을 정규 표현식으로 처리하기: 정규표현식 관련 질문에서는 ‘nan’ 문자열을 정규 표현식 안에서 처리하는 방법에 대한 설명이 제공됩니다. 해당 질문에서는 정규표현식에서 문자열을 어떻게 표현해야 하는지, 특히 ‘nan’과 같은 경우 어떻게 다뤄야 하는지에 대한 답변이 있습니다.

  2. DataFrame 컬럼 값 변환하기: get_string 에서 결측치 관련 질문에서는 map 함수와 get_string 함수를 사용해 DataFrame 컬럼의 값을 변환하는 과정이 언급됩니다. 이 질문은 ‘nan’ 값의 처리와도 관련이 있으며, 특정 함수를 사용하여 DataFrame 컬럼의 값을 어떻게 변환하는지에 대한 설명을 포함하고 있습니다.

이러한 예시들을 통해 'nan' 문자열 및 결측치 처리에 대한 이해를 높이고, 자신의 코드에 적절히 적용해 볼 수 있을 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

패키지 설치 에러 ydata-profiling

0

119

2

자세한 설명 부탁드려요 ㅜ

0

176

2

seaborn 라이브러리 호출하였으나 그래프가 안 그려져요

0

285

2

value_counts와 count 차이

0

340

2

안녕하세요 데이터 최신과 관련해서 문의드립니다.

0

204

3

scatterplot질문

0

122

1

강의 화면이 안나옵니다

0

164

2

4분12초 2013년부터 데이터가 없으면 어떻게하나요?..

0

187

2

에러 메시지

1

303

2

그래프 색이 동일하게 나옵니다.

0

308

2

시각화 라이브러리 비교

0

382

2

주피터 노트북 설치

0

390

1

2. 상가 기술통계 아웃풋 자료에서 오류가 납니다

0

226

1

14. distplot g = sns.FacetGrid(df_last, row="지역명", height=1.7, aspect=4) g.map(sns.distplot, "평당분양가격", hist=False, rug=True); 오류

0

178

1

group by agg function failed 에러

0

687

2

빈도수가 1000개 이상인 데이터를 따로 담을 때 코드 질문 있습니다.

0

288

2

주피터 노트북 실행 했는데 앞에 *가 생기고 결과가 나오지 않아요

0

363

3

seaborn X축 시작 지점 조정 질의의 건

0

212

1

14강 distplot 질의

0

289

1

nbextension 설치 및 셋팅 후 적용이 안되는 이슈

0

475

1

corr = df.corr() 입력시 오류

1

372

1

keyword grid_b is not recognized

0

334

1

%ls data 매직커맨드 사용시 한글 깨짐

0

291

1

피벗테이블 NotImplementedError

0

185

1