-
카테고리
-
세부 분야
딥러닝 · 머신러닝
-
해결 여부
미해결
8분 33초 df_train.corr()['SalePrice'] 부분 질문입니다.
23.04.28 12:50 작성 조회수 334
0
안녕하세요
항상 좋은 강의 해주셔서 감사합니다.
df_train.corr()['SalePrice'] 를 실행했더니,
ValueError: could not convert string to float: 'RL'
이런 벨류 에러가 뜹니다.
따라서 인터넷에 찾아보았더니, 'RL'
과 같은 문자열을 실수(float)으로 변환할 수 없다고 하며, 이러한 문자열이 존재하는 열은 데이터 타입이 숫자형이 아닌 문자형(object)일 가능성이 높다고 하는데, 위에서 해당 feature를 봤을 떄는 실수형이던데 왜 이런 오류가 발생하는지 아실까요?
처음하는 딥러닝과 파이토치(Pytorch) 부트캠프 [데이터과학 Part3]
딥러닝으로 Regression 문제 적용해보기 (House Price Kaggle 문제)
강의실 바로가기
답변을 작성해보세요.
0
잔재미코딩 DaveLee
지식공유자2023.05.01
안녕하세요. 답변도우미입니다.
이 문제는 데이터 프레임(df_train) 내에서 숫자가 아닌 값(예: 'RL')이 있는 열이 있어서 발생하는 문제입니다. corr() 함수는 숫자형 데이터에 대해서만 상관 계수를 계산할 수 있기 때문에, 문자열을 포함하는 열은 이 함수를 사용할 수 없습니다.
이 오류를 해결하려면, 문자열을 포함하는 열을 제외하고 corr() 함수를 사용하거나, 문자열을 숫자로 변환해야 하는데요. 해당 데이터에 결측치나, 문자열등의 값이 있는지를 확인해보시면 좋을 것 같습니다.
감사합니다.
답변 1