묻고 답해요
158만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
adapt() valid 포함
안녕하세요. 강의 잘 듣고있습니다. 듣는중에 궁금한 점이 생겨 질문드립니다. adapt(x) 말고 train만 집어 넣어야 하는 거 아닌가요? Valid도 검증 하려는 건데 정보를 집어 넣으면 데이터 누수에 문제가 생길거 같아서요.vectorizer = TextVectorization(standardize=custom_standardization, max_tokens=vocab_size, output_sequence_length=MAX_SEQUENCE_LENGTH) # X_train_text 만 넣어주면 valid 에 있는 어휘는 학습이 되지 않습니다. # test 에만 있는 어휘는 데이터 누수 문제로 사용하지 않습니다. vectorizer.adapt(X)
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
48강의 오디오가 나오지 않아요.
강의 내용 잘 들었습니다. 워낙 기본소양도 없는 왕초보여서.. 어려웠지만.. 큰 틀에서 흐름을 이해하는 데 도움을 받았습니다. 그런데, 마지막 48강에서 3분 정도 LDA 시각화된 자료 해석하는 것을 앞의 내용처럼 한번 더 해주신 것 같은데, 화면만 봐도 이해되도록 챗gpt 내용이 함께 나오긴 해서 일부러 오디오를 안 넣으신건지, 아님 혹시 실수로 오디오녹음본이 삭제된건지 확인해보시면 좋을 것 같아서요. 그래도 전체적으로 좋은 강의 감사합니다~
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
혼란도에 대해서 질문드립니다.
-강의 내용이나 궁금증이 있으시면 질문해 주세요!혹시 뉴스데이터를 전처리해서 혼란도를 계산하는데 강의처럼 혼란도 지표가 올라갔다 내려갔다 하지 않고 완만하다가 급격히 우상향하는데 대체로 이러한 모습을 보이는 것 같습니다. 혹시 이러한 이유를 어떻게 설명해야하는지 궁금하고, 최적의 토픽 수를 정할 때 응집도가 높고 혼란도가 낮은(여기서는 그래프의 높은지점)에서 정하는데 이를 둘다 만족하지 못할 때 응집도를 중심으로 정했다면 논문에 이를 어떻게 논리적으로 설명해야하는지 궁금하네요
-
미해결R로 하는 텍스트마이닝 (Top keyword부터 감성분석까지)
tagxedo 사이트 사용관련
크롬 아니고, 인터넷 익스플로러로 'tagxedo 사이트'에 접속해서 silverlight 설치를 했습니다. F5도 눌러보고, 재부팅도 해보고, 프로그램 재설치를 해봤지만 tagxedo 사이트를 이용하지 못하는 상태(siliverlight 설치하라는 화면만 나와요) 입니다.어떻게 해야하나요? 안내부탁드립니다.
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
구글코랩 실행이 안되서요
-강의 내용이나 궁금증이 있으시면 질문해 주세요!구글코랩 파일 업로드 안되네요. 그리고 검정 창이 아니라 ...
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
코드 에러
import koreanize_matplotlib 토픽모델링강의에서 위 코드 에러가 나는데, 뭔가 바뀐걸까요..?
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
질문드립니다.
안녕하세요 강의 잘듣고 있습니다. 감사합니다.실습 내용 중에 질문이 있습니다.워드클라우드 그리는 예시에서 워드클라우드에서 '했다', '하는', '한다' ,' 밝혔다' 이런 동사 형태가 많이 보이는데 어떻게 해결 해야 할까요?워드클라우드에서 '인공지능'이 '인공', '지능' 으로 분리되어 나타나는데 '인공지능'으로 합쳐서 집계되고 표현되게 하려면 어떻게 하나요?'오늘', '현재', '한국', 오후' 이런 단어는 지우고 싶은데 어떻게 하면 되나요? 전처리 과정을 어떻게 해야하는지 궁금합니다..!답변 부탁드립니다. 감사합니다.
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
감성 분석을 하려면 어떤 부분을 공부해야 하나요?
프로젝트에서 감성 분석과 주제 찾는 작업이 필요합니다.주제 찾기는 강의를 통해 배울수 있을거 같은데요 감성 분석은 어떤것을 공부하면 좋을까요?
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
Ucinet 활용한 CONCOR 데이터 추출이 안 돼요
안녕하세요!강의를 통해 연구논문을 작성하는데 큰 도움을 받고 있습니다. 정말 감사드립니다. 다름이 아니라 Ucinet 활용한 CONCOR(군집분석) 데이터 추출할 때 어려운 점이 있어 문의드립니다.CONCOR용 데이터 추출 할 때, CCpart CCperm Concor1st 데이터를 바탕화면에 저장하고자 파일 경로를 입력한 후에 OK 버튼을 누르면 Concor1st만 저장이 되고 나머지 2개의 파일은 저장이 안 되네요. 그래서 다음 단계로 진행하기가 어렵습니다. 이 문제를 어떻게 해결할 수 있을까요? ConcorCCpart만 따로 저장할 수 있는 방법도 있을까요?답변 주시면 감사하겠습니다!
-
미해결[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝
맥북은 ucinet사용이 제한되나요?
맥북사용자입니다. Ucinet이 깔리지 않아 방법 여쭙니다. 그리고 강의 내용과 현재텍스톰 매뉴얼이 바뀌었네요,혹시 바뀐 버전으로 강의를 들을 수는없는지도 같이 여쭙니다.
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
pyLDAvis 오류
제공해주신 idavis 오류 파일을 실행하면 시각화가 되는데, 기존파일에 내용을 붙여서 실행하면 안되는 이유는 뭘까요?오류 내용 첨부해 드립니다.
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
수업자료 다운로드 링크 에러
안녕하세요 강사님,수업자료를 다운로드하려고 하는데 이론 슬라이드 다운로드 링크 연결이 안됩니다.bitly 시스템에서 블락되었다고 뜨는데 확인부탁드려요.
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
BERTopic에 대해서 질문드립니다.
-강의 내용이나 궁금증이 있으시면 질문해 주세요! BERTopic을 할때는 데이터가 LDA를 할 때 처럼 형태소 분석된 데이터가 아닌원본 데이터를 그대로 입력으로 줘야 하나요?데이터는 동일하게 빅카인즈입니다.
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
TF-IDF값에 대해서 질문드립니다.
안녕하세요저도 동일하게 빅카인드 뉴스데이터로TF-IDF 분석을 하다 본 강의를 알게되었는데 TF-IDF 값이 주신 자료의 코드로 분석은 되는데값이 크게 나온 이유가 뭘까요? 강의자료의 예시 파일로 3자리 숫자가 나오는데통상 0.몇의 숫자로 표현되지 않나요? 코드의 계산식을 이용해서 값이 나온 결과를 설명해주세요
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
모두의 한국어 텍스트 분석과 자연어처리 with 파이썬 -> 섹션 3 부터 재생이 안됩니다.
안녕하세요.모두의 한국어 텍스트 분석과 자연어처리 with 파이썬위 과정을 수강중에 있는데요.. 섹션 3부터 재생이 안됩니다..
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
수업 자료 관련
안녕하세요, 수업 자료 어디에서 다운 받을 수 있나요?
-
미해결[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝
텍스톰으로 Bertopic을 사용할 수는 없나요?
이제 논문을 준비해야 하는데 최근에 Bertopic을 사용한 논문이 많이 보이더라구요. 혹시 텍스톰으로 Bertopic 방법을 사용할 수 있을까요? 만약 불가능하다면 파이썬에 대한 지식이 없는 초보자가 bertopic 방법을 사용하기는 힘들까요? 바쁘시겠지만 답변 부탁드립니다 감사합니다
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.
0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.강의에서는 Silhouette 이 부분이 1과 가까워지는 부분에서 좋은 n_cluster라고 하셨는데 그러면Elbow 차트 말고 Silhouette 만 써도 되는건가요?0204 쇼핑 리뷰 군집화 결과 분석 - 실제 제품과 군집 교차표 분석 4분 16초에 k.meanslabel==pardict를 하는 이유가 뭔가요? 라벨링 개수와 학습한 개수를 같은지 확인하는 이유가 궁금합니다.
-
미해결모두의 한국어 텍스트 분석과 자연어처리 with 파이썬
load_metric 에러 발생
from datasets import load_metricImportError: cannot import name 'load_metric' from 'datasets' (/usr/local/lib/python3.10/dist-packages/datasets/__init__.py) datasets에서 load_metric을 불러오려고 하는데 위와 같은 에러가 발생합니다. 계속 삽질하고 있는데 방법을 찾기가 쉽지가 않네요ㅠ 도움 부탁드립니다.
-
미해결빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
원하는 결과를 얻기 위한 데이터 전처리 관련
안녕하세요word_count 파일을 가지고 전처리를 하기 위해 유사어나 제외어를 처리를 위해 library파일을 만들었습니다A 컬럼에는 제외할 키워드를 지정하고 B 칼럼에는 빈 공간을 두었습니다그리고 유사어 경우 A컬럼에는 '국가' B칼럼에는 '나라' 를 기입했습니다. 그리고 제공해준 대로 코딩을 해서 키워드 빈도나 워드 크라우드를 실행해도 수정되지 않은 결과가 나옵니다(제외할 키워드, 수정할 키워드 반영이 안됨)왜 그런지 ? 어떤 과정이 문제인지 잘 모르겠습니다그리고 만약 유사어를 여러개를 지정할 때, 예를 들면 ' 지역주민'과 유사어가 '시민' , '주민' 등과 같이2개이상일 경우에는 어떻게 작성해야 하는지도 궁금합니다