inflearn logo
강의

Course

Instructor

Everyone's Korean Text Analysis and Natural Language Processing with Python

설문조사 주관식 데이터 처리방법 문의

1123

joylee

2 asked

0

이전에 고객 설문데이터를 가지고 보고서를 만들었던 경험이 있습니다.

객관식은 전체 응답기준으로 엑셀로 매크로를 이용하여 그래프를 만들면 되는데

문제는 주관식입니다.

주관식은 요약을 보고서에 담아야 되어서, 전체를 읽어보고 전체 의견요약을 하고,

긍정의견, 부정의견을 나누고 그에 대한 요약을 작성을 일일이 사람이 전체를 읽어서 처리를 합니다.

건수가 작으면 혼자 하면 되는데 20만건 데이터 처리는 혼자는 하기 힘들고 여러명이 나눠서 해야만 됩니다.

 

데이터가 많을 경우 ChatGPT로 요약을 해보니 최대 처리할 수 있는 데이터 크기가 32k까지 밖에 처리가 되지 않아 몇%만 샘플링해서 요약하는 방법밖에 없었습니다. 그럼 샘플링에 따라서 고객의견이 정확하게 반영이 되 지않아 결국은 여러명이 수작업으로 진행했습니다.

 

자연어 처리로 자동으로 긍정, 부정을 분류까지는 가능할것도 같은데 분류된 데이터 가지고 긍정의견의 요약, 부정의견의 요약을 딥러닝으로 해결이 가능할까요?

아니면 어떤 좋은 방법이 있을까요?

python 머신러닝 빅데이터 NLP 텍스트마이닝 data-clustering 데이터-리터러시

Answer 1

0

todaycode

안녕하세요.

여러가지 방법이 있을 수 있습니다.

랭체인과 같은 도구를 사용할 수도 있고요. 이건 따로 배워야 하기 때문에 간단한 API를 사용하고자 한다면

한번에 처리 되지 않는 데이터를 나눠서 반복문으로 API를 호출하며 처리해 보는 건 어떨지 싶습니다.

여러 사람이 나눠 하는 일을 코드로 작성해서 API 호출을 통해 요약하거나 레이블링 해보는 것을 추천합니다.

감사합니다.

작업형 1 유형 부분

0

9

1

수강평 이벤트

0

15

2

import torch가 안되는 경우는 어떻게 하나요?

0

15

1

작업형 1 (삭제예정, 구 버전)

0

28

2

강의노트는 어디있나요?

0

15

1

노션 학습 자료 권한 요청

0

15

1

수강기간 연장 문의드립니다.

0

20

1

2유형 레이블 인코딩 VS 원핫 인코딩

0

21

3

part2강의 문의사항입니다.

0

19

2

Component 수는 어떻게 지정을 해야 할까요?

0

95

2

adapt() valid 포함

0

72

1

코드 에러

0

146

2

감성 분석을 하려면 어떤 부분을 공부해야 하나요?

0

205

2

수업자료 다운로드 링크 에러

0

157

2

모두의 한국어 텍스트 분석과 자연어처리 with 파이썬 -> 섹션 3 부터 재생이 안됩니다.

0

152

1

0204 쇼핑 리뷰 군집화 - KMeans, Elbow, Silhouette 분석 강의 질문있습니다.

0

215

2

load_metric 에러 발생

0

1127

2

강의에서 사용하는 csv 파일이 없습니다

0

266

2

적합한 알고리즘이나 라이브러리를 알고싶습니다

0

243

1

안녕하세요 선생님

0

312

1

kkma() 실행시 kernel dead 현상이 발생합니다.

0

488

3

감성분석

0

383

1

해당 강의 내용 영문에 적용하는 방법

0

420

1

PDF기준으로 LLM에게 답변/요약을 요청할때 가능한 방법 문의

1

1281

2