• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

8분 33초 df_train.corr()['SalePrice'] 부분 질문입니다.

23.04.28 12:50 작성 조회수 334

0

안녕하세요
항상 좋은 강의 해주셔서 감사합니다.
df_train.corr()['SalePrice'] 를 실행했더니,
ValueError: could not convert string to float: 'RL'
이런 벨류 에러가 뜹니다.
따라서 인터넷에 찾아보았더니, 'RL'과 같은 문자열을 실수(float)으로 변환할 수 없다고 하며, 이러한 문자열이 존재하는 열은 데이터 타입이 숫자형이 아닌 문자형(object)일 가능성이 높다고 하는데, 위에서 해당 feature를 봤을 떄는 실수형이던데 왜 이런 오류가 발생하는지 아실까요?

답변 1

답변을 작성해보세요.

0

안녕하세요. 답변도우미입니다.

이 문제는 데이터 프레임(df_train) 내에서 숫자가 아닌 값(예: 'RL')이 있는 열이 있어서 발생하는 문제입니다. corr() 함수는 숫자형 데이터에 대해서만 상관 계수를 계산할 수 있기 때문에, 문자열을 포함하는 열은 이 함수를 사용할 수 없습니다.

이 오류를 해결하려면, 문자열을 포함하는 열을 제외하고 corr() 함수를 사용하거나, 문자열을 숫자로 변환해야 하는데요. 해당 데이터에 결측치나, 문자열등의 값이 있는지를 확인해보시면 좋을 것 같습니다.

감사합니다.