인프런 커뮤니티 질문&답변

임환규님의 프로필 이미지
임환규

작성한 질문수

처음하는 파이썬 데이터 분석 (쉽게! 전처리, pandas, 시각화 전과정 익히기) [데이터분석/과학 Part2]

XML 포맷 이해와 파이썬으로 XML 파일 다루기2

XML 파일다루기2에서 예제 객체.content 문의

작성

·

232

·

수정됨

0

안녕하세요! 수업 듣다가 궁금한 점이 있어 문의드립니다.

  • 강의 제목: 섹션3 "XML 포맷 이해와 파이썬으로 XML 파일 다루기2"

  • 문의 관련 강의 시점: 해당 강의의 3:15 부근

  • 문의 내용: 예제를 풀어보니 이 문제에서는

    soup = BeautifulSoup(response.text, 'xml')이랑 soup = BeautifulSoup(response.content, 'xml')

    모두 출력이 맞게 나오는데 객체.text랑 객체.content랑 어떤걸 써도 상관이 없은건가요? 무슨 차이가 있는지 문의드립니다.

답변 1

0

안녕하세요. 답변도우미입니다.

response.textresponse.content 사이에는 살짝 차이가 있습니다. 이 차이는 데이터 타입과 인코딩 처리 방식에 있습니다.

  1. response.text: 응답 데이터를 Unicode 문자열로 반환합니다. requests 라이브러리가 자동으로 인코딩을 추측하고 변환합니다. 대부분의 경우, 텍스트 데이터를 다룰 때 response.text를 사용하면 편리합니다.

  2. response.content: 응답 데이터를 바이트(byte) 형태로 반환합니다. 인코딩 처리가 되지 않은 원시 데이터(raw data)를 반환하며, 특히 바이너리(binary) 파일을 다룰 때 사용합니다.

두 가지 방식 모두 출력이 정상적으로 나오는 경우, 웹페이지의 인코딩이 올바르게 처리되었다는 것을 의미합니다. 하지만 일반적으로는 response.text를 사용하여 텍스트 기반의 웹페이지를 처리하는 것이 좋습니다. 이렇게 하면 requests 라이브러리가 인코딩을 자동으로 처리해주기 때문에 인코딩 관련 문제가 발생할 가능성이 줄어듭니다.

감사합니다.

임환규님의 프로필 이미지
임환규

작성한 질문수

질문하기