강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

신정연님의 프로필 이미지
신정연

작성한 질문수

빅데이터분석기사 실기대비 (R 활용)

데이터 입출력

read.csv 오류

작성

·

2.9K

0

안녕하세요!
R 4.2.0 최신 버전이 컴퓨터에 깔려있었어서 그걸로 수강중인데요
 
X_test 파일에 한글이 있어서
 
type.convert.default(data[[i]], as.is = as.is[i], dec = dec, 에서 다음과 같은 에러가 발생했습니다: '<b0><f1><c7><c1>'에서 유효하지 않은 멀티바이트 문자열이 있습니다
 
라는 오류메세지가 뜹니다.
파일에서 한글을 전부 삭제한 후에 read.csv하니까 오류가 나지 않는데, 한글을 삭제하는 것 외에 다른 방법이 있을까요?

답변 1

0

companionclub님의 프로필 이미지
companionclub
지식공유자

 

안녕하세요.

동일한 현상을 재현하기 위해서 같은 버전의 R을 설치하고 데이터를 불러왔는데 저는 에러가 없었습니다.

여러가지 이유를 추정해볼 수 있겠지만 작업 환경을 직접 확인 할 수 가 없어서 단정짓기가 어렵습니다.

OS가 다르다던가, OS의 사용자명이 한글이라던가 등의 환경이 다를 수 있을 것 같습니다.

 

X_test <- read.csv('C:/X_test.csv')

 

이 명령어 뒤에 아래와 같은 옵션을 추가해서 시도해보는 방법이 있습니다.

fileEncoding = "CP949", encoding = "UTF-8"

encoding 종류도 UTF-8말고 euc-kr 등이 있습니다. 어떤 것이 동작할지는 확답을 어렵습니다.

 

참고로 저는 Windows OS에서 작업을 했으니 참고를 부탁드립니다.

부디 잘 해결되시길 바랍니다.

신정연님의 프로필 이미지
신정연
질문자

옵션 추가하여 해결되었습니다 감사합니다!!

신정연님의 프로필 이미지
신정연

작성한 질문수

질문하기