inflearn logo
강의

강의

N
챌린지

챌린지

멘토링

멘토링

N
클립

클립

로드맵

로드맵

지식공유

[개정판] 파이썬 머신러닝 완벽 가이드

회귀 실습 2: 캐글경연 주택가격 예측 - Advanced Regression Techniques - 01

5.6 실습코드 오류질문

689

김도형

작성한 질문수 6

0

이렇게 nan으로 다 뜨는데 이유가 무엇일까요..

이렇게 에러가 뜹니다. 참고로 주신 코드 그대로 돌렸습니다ㅠ

python 머신러닝 통계

답변 3

0

sonhs1

안녕하세요 .

저역시 해당 문제를 겪어 그냥 넘어 갈까 하다가 나중의 실습문제도 동일하게 겪을거 같아 근본적인 원인을 파악해보고자

에러의 내용을 확인해 보았습니다.

해당 에러를 보면 결국 pandas는 scipy 모듈을 호출합니다.

즉 pandas와 scipy 모듈은 서로 종속성이 있다는 의미이어서

sklearn과 호환되는 scipy 버전을 찾아야 합니다.

pip install scipy==1.7.3 을 설치하니 해당 문제가 해결되었습니다.

강사님 강의는 잘 듣고 있습니다.

조금 아쉬운 점은 conda를 사용하면 대충 다 깔리기에 실제 강의에 사용된 종속성을 가진 패키지의 버전은 명시할 필요가 있지 않을까 합니다.

0

김도형

이렇게 나옵니다!

0

권 철민

새로운 Conda 환경을 구성하는게 베스트이긴 한데, 그럴려면 scikit learn == 1.0.2 부터 pandas 등 필요한 라이브러리를 직접 설치하셔야 합니다. 또 jupyter notebook에서 해당 conda 환경을 잡고 올라올 수 있도록 작업이 필요합니다. 인터넷등을 참조해서 작업이 가능하시다면 한번 해보시는 것도 좋을 것 같습니다. 잘 안되시면 그때 새로 conda를 설치하시면 어떨까 싶습니다.

0

권 철민

안녕하십니까.

음. nan이 나올 이유가 없을 것 같습니다만.

X_data = bostonDF.drop(...) 다음에

print(X_data.shape) 하셔서 X_data값이 나오는지 확인해 보시겠습니까?

X_data 값이 나오면, print(y_target.shape) 하셔서 y_target값이 나오는지도 확인해 보시겠습니까?

감사합니다.

0

김도형

(506, 13)
(506,)

네 각각 이렇게 나옵니다.

 

0

권 철민

데이터는 문제가 없어 보이는데,

print(neg_mse_scores)

print(rmse_score)

print(avg_rmse)

하셔서 어디서 nan이 나오는지 확인해 보시겠습니까,

그리고

import sklearn

print(sklearn.__version__) 하셔서 sklearn 버전도 부탁드립니다.

0

김도형

image이렇게 나옵니다!

0

권 철민

음, cross_val_score() 리턴값이 nan이 나오는 군요.

원인은 잘 모르겠군요. 해당 실습 코드는 scikit learn 1.0.2 에서 문제없이 동작합니다.

혹 최근에 pandas나 numpy 또는 다른 패키지를 설치하거나 upgrade 하신적이 있는지요?

현재 conda 환경에서 수행이 되지 않으면 colab등의 환경에서 실습코드를 수행해 보십시요. 단 colab에서는 pip install scikit-learn==1.0.2 로 downgrade한 후에 커널을 재 기동하여 수행하셔야 합니다. 이렇게 해보시고 안되시면 다시 글 부탁드립니다.

0

김도형

그럼 여기서는 왜 에러가 나오는 걸까요..?

0

권 철민

제 생각엔 다른 패키지를 설치하면서 넘파이가 꼬인것 같습니다.

Load boston 데이타세트 말고 이후 강의의 다른 데이터 세트로 회귀 실습 해보시고 여전히 오류가 발생하면 아예 아나콘다를 다 날리고 재 설치 하셔야 할것 같습니다

Load boston 데이타세트에서만 오류 발생하면 다시 글 올려주세요. 그리고 오류 메시지는 캡터 뜨지 마시고 텍스트로 여기에 올려주세요

0

김도형

아니면 아나콘다 전체를 삭제하지 말고 base가 아닌 다른 환경을 생성해서 그 커널에서 하면 해결이 안될까요?

모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.

0

19

2

안녕하세요 열심히 수강중인 학생입니다

0

65

2

정수 인덱싱

0

71

2

넘파이 오류

0

86

2

11강 numpy의 axis 축 질문 드립니다.

0

89

2

Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.

0

80

2

Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.

0

71

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

76

2

타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.

0

65

2

5강 강의 오류가 있어요.

0

86

1

실무에서 LTV 관련 모델 선택 질문입니다!

0

74

2

14강 강의 듣는중에 궁금한게 있어서 질문합니다~

0

70

3

파이썬 다운그레이 후 사이킷런 재설치

0

120

2

좋은 강의 감사합니다.

0

75

2

scoring 함수 음수값

0

68

2

6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?

0

102

2

분류 평가 정확도 예측

0

80

2

안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.

0

100

1

카카오톡 채널 있나요

0

109

1

혹시 강의에서 사용하시는 ppt 받을 수 있는건가요

0

191

2

pca 스케일링 관련하여 질문드립니다.

0

101

2

주피터 대신 구글 코랩

0

173

2

강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?

0

149

2

실루엣 스코어..

0

87

2