pandas 라이브러리의 quotechar 인자에 대해 질문드립니다
96
작성자 없음
작성한 질문수 0
EDA 기본 패턴 적용을 위한 pandas 관련 문법 활용1(업데이트) 강의에서,
pandas 라이브러리로 csv 파일 읽기에 다음과 같은 예문이 나오는데요.
doc = pd.read_csv("파일명", encoding="utf-8-sig", quotechar=",")
구분자는 delimiter 인자를 사용하는 것으로 알고 있었는데, quotechar를 사용하신 이유가 궁금합니다. delimiter와 quotechar의 차이가 무엇인가요?
답변 1
0
안녕하세요, 인프런 AI 인턴입니다. 이선경님, 질문에 대한 답변 드리겠습니다.
pandas에서 read_csv를 사용할 때, delimiter와 quotechar는 서로 다른 목적으로 사용되는 인자입니다.
delimiter: 이 인자는 CSV 파일에서 열을 구분하는 데 사용되는 문자입니다. 일반적으로 콤마(,)가 많이 사용되지만, 탭이나 세미콜론과 같은 다른 문자가 사용될 수도 있습니다. 예를 들어, 탭으로 구분된 파일을 읽을 때는
delimiter='\t'로 설정합니다.quotechar: 이 인자는 CSV 파일 내에서 데이터를 묶는 데 사용되는 문자를 지정합니다. 기본적으로 따옴표 (“)가 사용됩니다. 파일 내에서 실제로 쉼표를 데이터의 일부로 포함해야 할 경우, 이 부분을 따옴표로 감싸 사용합니다. 예를 들어, “Hello, World”와 같은 방식으로 데이터를 담습니다.
이러한 이유로, quotechar는 데이터 내 텍스트가 잘못 분리되는 것을 방지하기 위해 사용됩니다. delimiter가 열 사이의 구분자를 나타낸다면, quotechar는 데이터 안에서 구분자나 특수 문자가 사용될 때 이를 무시하고 그 데이터를 하나의 덩어리로 취급하기 위해 사용됩니다.
관련된 질문과 그에 대한 추가적인 설명은 아래 링크를 통해 확인하실 수 있습니다:
- PANDAS라이브러리로 데이터가공하기 1 질문드립니다!
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
Python 3 표시 없습니다.
0
51
1
강의실습 말고 강의에 대한 자료(pdf)가 없을까요?
0
64
1
구글 코랩과 아나콘다
0
78
1
강의와 다르게 오류가 뜨는 이유가 뭘까요?
0
94
1
COVID-19-master 관련 등 자료 누락
0
81
1
수업자료에 python_core_summary.ipynb 파일이 포함되어 있지 않습니다!
1
94
1
json.dumps관련된 질문
0
70
1
빅분기대비
0
110
1
파이썬으로 Plain Text 포멧 파일 다루기 연습문제 질문
0
92
1
강의자료 어디서 다운로드받나요?
0
137
1
iplot 에러 문제
1
199
1
플래그
0
74
1
플래그 라이브러리
0
81
1
CSV 파일 쓰기 다른 기법(사전 타입으로 쓰기) 관련
0
177
1
CSV 파일 읽을 때 오류
0
189
1
read() 함수 사용할 때 3번째 줄에 data로 출력 또는 print(data)로 출력 차이
0
135
1
강의 교재 및 실습 파일 제공되나요?
0
177
1
deep_data_and_visual 파일에서 에러가 납니다.
0
180
1
apply()함수
0
199
1
pandas groupby sum 질문
1
269
1
pandas_eda 자료 맨아래 heatmap 숫자가 안나옵니다
0
348
2
pandas_eda 힛맵에서 숫자가 안떠요
0
252
1
수업 자료에 pandas_basic 파일이 없습니다..!
0
274
1
EDA기본패턴 적용을 위한 pandas문법에서 필요한 파일이 파이썬에서 안옮겨집니다
0
201
1





