-
카테고리
-
세부 분야
데이터 분석
-
해결 여부
미해결
CountVectorizer 파라미터 값 질문
19.05.03 15:10 작성 조회수 162
1
안녕하세요.
countvectorizer의 파라미터 값에 대해 궁금해 질문 남깁니다.
찾아보니, tokenizer, analyzer, token_pattern 의 인수가 모두 토큰 생성기 선택에 관한 인수라고 나와있던데 각각의 인수가 뜻하는 게 뭔지 정확히 알고 싶습니다.
찾아본 바로는
tokenizer: 함수 또는 None(default), 토큰 생성 함수
analyzer: 문자열 {'word', 'char', 'char_wb'} 또는 함수
token_pattern: string, 토큰 정의용 정규표현식
이라고 설명되어있던데 정확한 설명을 구할 수 없어 질문 드립니다. 답변 부탁드립니다.
답변을 작성해보세요.
답변 0