선생님 질문있습니다.
188
작성한 질문수 37
선생님 강의 너무 잘듣고 있습니다..!
감성분석을 하다가 갑자기 문득 든 생각인데요. 어떤 특정한 텍스트가 많이 나오면 긍정 아니면 부정으로 분류예측을 수행하는데
만약 각 행의 label 값이 긍정, 부정의 총 count 값으로 나오면 어떤 분석법을 사용해야 하나요??
그리고 긍정, 부정의 피처타입이 문자(좋아요, 싫어요 같이)로 되어있으면 원핫인코딩으로 인코딩 해도 될까요??
답변 1
0
안녕하십니까,
지금 텍스트 분석 섹션을 학습하고 계신 중에 올려주신 건가요? 올려 주신 질문이 좋은 질문이긴 한데, 아이디어를 좀 더 다듬어서 질문을 다시 해주시면 좋을 것 같습니다.
1. 문서가 아니라 문서내의 각 행의 label값이 긍정 부정의 총 count라는 말씀이신가요?
음, 암튼 문서 또는 각 행의 label 값이 긍정, 부정의 총 count라면 train 역시 문서/각 행의 예측 label의 긍정 부정 총 count가 얼마인지를 나타내는 모델이 되어야 합니다. 회귀 모델이 되어야 할 것 같습니다만,
근데 긍정 부정의 총 count라는게 긍정과 부정을 다 합친 총 count인건지, 아님 긍정 count, 부정 count각각 건수가 몇개라는 건지요?
2. 긍정, 부정이 label이 아니라 피처 타입이라는 건가요? 피처면 feature vectorization을 적용하면 됩니다만, 굳이 또 원/핫 인코딩을 할 필요는 없을 것 같습니다.
0
긍정, 부정 각각의 count를 구하기를 원하시는 건가요? 그럼, 회귀 모델로 해야 합니다.
다만 사이킷런 회귀 모델은 최종 예측이 하나의 연속형 값으로만 나와야 합니다. 때문에 2개의 결과 값을 예측 값으로 도출하려면 keras와 같은 framework으로 두개의 회귀 layer를 만들어서 예측해야 합니다.
모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.
0
50
2
안녕하세요 열심히 수강중인 학생입니다
0
86
2
정수 인덱싱
0
86
2
넘파이 오류
0
108
2
11강 numpy의 axis 축 질문 드립니다.
0
106
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
93
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
76
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
83
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
73
2
5강 강의 오류가 있어요.
0
90
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
81
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
75
3
파이썬 다운그레이 후 사이킷런 재설치
0
128
2
좋은 강의 감사합니다.
0
79
2
scoring 함수 음수값
0
72
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
108
2
분류 평가 정확도 예측
0
87
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
114
1
카카오톡 채널 있나요
0
118
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
193
2
pca 스케일링 관련하여 질문드립니다.
0
109
2
주피터 대신 구글 코랩
0
184
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
155
2
실루엣 스코어..
0
91
2





