너무 궁금해서 문의드려봅니다.
안녕하세요. 책도보고 동영상도 보고 있는데 너무 궁금해서
이렇게 강의와 직접적인 관련이 없는데도 불구하고
이런 경우는 어떻게 접근해야할지 몰라서 문의드려봅니다.
문장의 예)
Gildong weighs 60kg.
Cheolsu weighs 70kg.
Younghee weighs 49kg.
위 문장 텍스트에서 영희라는 사람의 몸무게를 구하고 싶습니다.
기존 개발방법이라면
문장으로 배열화 시켜서 for문 돌리면서 if문 사용하여 Younghee, weighs 단어가 포함된 문장배열에서
kg이 포함된 단어 또는 정규식으로 사용하든지해서 구할것입니다.
그러나 이렇게 나온 데이터가 AI영역에서는 의미가 없어 보입니다.
비정형화된 텍스트에서 특정 원하는 값을 구하고싶은데
AI 머신러닝 딥러닝의 개념으로 처리를 한다면 어떻게 접근해야할지 너무 감이 안옵니다.
정말 그냥 for문, if문 사용해서 영희의 몸무게를 뽑아내야하는건지
AI 개념에서는 어떻게 접근해야할지 작은 조언이라도 부탁드립니다.
답변 1
0
안녕하십니까,
어떤 부분을 고민하시는지 대강은 알겠는데, 답변을 어떻게 드려야 할지 저도 잘 모르겠습니다.
위의 질문에서 영희라는 사람의 몸무게를 구하는 거라면 적어주신대로 프로그램로직과 정규식을 통해서 구하는게 답입니다. 이걸 AI 기반으로 구한다는게, 어떤 의미 인지 정확히는 모르겠습니다(물론 어떤 부분이 고민이실 지는 충분히 이해 합니다)
제 생각에는 텍스트에 이미 답이 있는 경우라면 굳이 AI를 쓰지 않고, 정규식을 쓰면 될 것입니다. AI를 사용한다는 것은 (지도학습의 경우) 학습데이트를 기반으로 원하고자 하는 목표를 얻기 위한 모델을 만들고, 답이 없는 경우를 문제로 내서 예측을 해보라는(답을 풀어보라는) 경우가 일반적입니다.
가령 아래와 같은 Text가 있다면,
Gildong is male and weighs 60kg.
Cheolsu is male and weighs 70kg.
Suji is female and weights 50kg
이때 영희의 몸무게를 AI로 구해보라는 식입니다. 하지만 이것 역시 AI로 구하기 만만하지 않습니다. 일단 학습 데이터 세트를 만들기 어렵습니다. 학습 데이터 세트는 Feature와 Target 값으로 구성되는데, 문장에서 60KG이라는 결과값을 추출해내서 Target값을 만들어야 합니다. (물론 이미 학습된 데이터 세트가 있다면 얘기는 다릅니다만)
이게 AI이든, 그렇지 않든, 풀고자 하는 문제영역을 먼저 정의해야 합니다. 가령 특정 문장이 부정적인지/긍정적인지 파악을 한다든가, 해당 문단이나/글이 특정작가가 만든 글인지, 또는 특정 뉴스가 어떤 카테고리에 속하는지, 아님 특정 웹사이트글이 가짜 뉴스인지, 또는 한국어를 영어로 번역한다든지입니다. 이렇게 문제 영역이 정의되면, 해당 문제와 답을 학습할 수 있는 데이터 세트가 있어야 합니다(사실 지도학습은 학습 데이터 만드는게 매우 큰일입니다)
먼저 고민이 되시는 문제 영역을 함 다시 정의하시고 그 부분을 어떻게 AI로 풀어낼지 생각해 보시는건 어떨지요? 답이 아니라면 다시 글 업데이트 부탁드립니다.
감사합니다.
모델 서빙과 관련된 강좌가 출시되는지 질문드립니다.
0
24
2
안녕하세요 열심히 수강중인 학생입니다
0
68
2
정수 인덱싱
0
71
2
넘파이 오류
0
88
2
11강 numpy의 axis 축 질문 드립니다.
0
89
2
Kaggle 에서 Santander customer satisfaction data 를 다운로드 되지가 않습니다.
0
80
2
Feature importances 를 보여주는 barplot 이 그래프로 안보여져요.
0
71
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
76
2
타이타닉 csv 파일이 주피터 화면에 보이지 않습니다.
0
65
2
5강 강의 오류가 있어요.
0
86
1
실무에서 LTV 관련 모델 선택 질문입니다!
0
74
2
14강 강의 듣는중에 궁금한게 있어서 질문합니다~
0
70
3
파이썬 다운그레이 후 사이킷런 재설치
0
122
2
좋은 강의 감사합니다.
0
75
2
scoring 함수 음수값
0
68
2
6번 강의에 사이킷런, 파이썬, 아나콘다 각각 버전 일치 안 시키고 진행해도 강의 따라가 지나요?
0
104
2
분류 평가 정확도 예측
0
80
2
안녕하세요. 강의 들으면서 업무에 적용하고 싶은 수강생입니다.
0
100
1
카카오톡 채널 있나요
0
110
1
혹시 강의에서 사용하시는 ppt 받을 수 있는건가요
0
191
2
pca 스케일링 관련하여 질문드립니다.
0
102
2
주피터 대신 구글 코랩
0
174
2
강의에서 사용하는 pdf or ppt자료는 따로 없는 건가요?
0
149
2
실루엣 스코어..
0
87
2





