sklearn NaN 처리방법
4437
작성한 질문수 2
안녕하세요. part 2의 아래의 코드 실행 시 오류가 발생합니다.
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-67-0162f257485a> in <module>() ----> 1 get_ipython().magic('time forest = forest.fit(trainDataVecs, train["sentiment"] )')
<decorator-gen-60> in time(self, line, cell, local_ns)
<timed exec> in <module>()
/usr/local/lib/python3.6/dist-packages/sklearn/utils/validation.py in _assert_all_finite(X, allow_nan, msg_dtype) 58 msg_err.format 59 (type_err, ---> 60 msg_dtype if msg_dtype is not None else X.dtype) 61 ) 62 # for object dtype data, we only check for NaNs (GH-13254)
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
해결방법이 있을 지 문의드립니다.
답변 1
0
안녕하세요.
사이킷런을 통해 fit 으로 학습을 시킬때는 결측치가 없어야지 연산의 오류가 발생하지 않아요.
위 오류 메시지를 보면 학습데이터인 trainDataVecs안에 결측치가 있어서 오류가 발생했어요.
일단 trainDataVecs의 결측치를 확인해 보시는게 좋을거 같은데요.
trainDataVecs의 결측치를 0 으로 채워주시는것도 방법중에 하나가 될거 같아요!
해보시고 안 되면 다시 질문 남겨주세요.
감사합니다.
word2vec 질문
0
305
1
질문 드립니다
0
325
1
%time clean_train_reviews = apply_by_multiprocessing(\ train['review'], review_to_words, workers=4)
0
329
2
한국어 텍스트 분석과 영어 텍스트 분석의 차이
0
551
1
코랩 실습 링크 파일 다시 올려주시면 안되나요?
0
465
1
강의 자료는 어디서 받을 수 있나요?
0
350
1
data폴더안에 tsv파일이 없다고 나오는데 어떻게 해야하나요?
1
718
4
젠심
1
385
1
질문드립니다
1
232
1
질문드립ㄴ디ㅏ
1
409
3
질문드립니다
1
335
2
word2vec 실행 오류
1
382
1
gensim 4.0 버전 문제
1
2173
1
멀티 프로세싱 오류 질문입니다
1
1099
1
1-2 NLP 텍스트 데이터 처리 오류 관련 질문드립니다.
1
352
1
1강 질문드립니다.
1
235
1
질문드립니다.
1
428
2
질문드립니다.
1
210
1
id 말고 어떤 영화인지는 어떻게 알수있을까요?
1
281
1
[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리
1
481
1
has no attribute 'syn0'
2
324
1
영상 "섹션1. [2/4] NLP 텍스트 데이터 전처리" 부분에 대해 질문 있습니다!
1
311
5
wget 오류
1
781
1
html5lib 과 lxml 에서 모두 에러가 발생하고 있습니다.
1
528
1





