• 카테고리

    질문 & 답변
  • 세부 분야

    딥러닝 · 머신러닝

  • 해결 여부

    미해결

너무 궁금해서 문의드려봅니다.

20.12.20 05:40 작성 조회수 109

0

안녕하세요. 책도보고 동영상도 보고 있는데 너무 궁금해서

이렇게 강의와 직접적인 관련이 없는데도 불구하고

이런 경우는 어떻게 접근해야할지 몰라서 문의드려봅니다.

문장의 예)

Gildong weighs 60kg.

Cheolsu weighs 70kg.

Younghee weighs 49kg.

위 문장 텍스트에서 영희라는 사람의 몸무게를 구하고 싶습니다.

기존 개발방법이라면

문장으로 배열화 시켜서 for문 돌리면서 if문 사용하여 Younghee, weighs 단어가 포함된 문장배열에서

kg이 포함된 단어 또는 정규식으로 사용하든지해서 구할것입니다. 

그러나 이렇게 나온 데이터가 AI영역에서는 의미가 없어 보입니다.

비정형화된 텍스트에서 특정 원하는 값을 구하고싶은데

AI 머신러닝 딥러닝의 개념으로 처리를 한다면 어떻게 접근해야할지 너무 감이 안옵니다.

정말 그냥 for문, if문 사용해서 영희의 몸무게를 뽑아내야하는건지

AI 개념에서는 어떻게 접근해야할지 작은 조언이라도 부탁드립니다.

답변 1

답변을 작성해보세요.

0

안녕하십니까,

어떤 부분을 고민하시는지 대강은 알겠는데, 답변을 어떻게 드려야 할지 저도 잘 모르겠습니다.

위의 질문에서 영희라는 사람의 몸무게를 구하는 거라면 적어주신대로 프로그램로직과 정규식을 통해서 구하는게 답입니다. 이걸 AI 기반으로 구한다는게, 어떤 의미 인지 정확히는 모르겠습니다(물론 어떤 부분이 고민이실 지는 충분히 이해 합니다)

제 생각에는 텍스트에 이미 답이 있는 경우라면 굳이 AI를 쓰지 않고, 정규식을 쓰면 될 것입니다. AI를 사용한다는 것은 (지도학습의 경우) 학습데이트를 기반으로 원하고자 하는 목표를 얻기 위한 모델을 만들고, 답이 없는 경우를 문제로 내서 예측을 해보라는(답을 풀어보라는) 경우가 일반적입니다.

가령 아래와 같은 Text가 있다면,
Gildong is male and  weighs 60kg.
Cheolsu is male and weighs 70kg.
Suji is female and weights 50kg

이때 영희의 몸무게를 AI로 구해보라는 식입니다.  하지만 이것 역시 AI로 구하기 만만하지 않습니다. 일단 학습 데이터 세트를 만들기 어렵습니다. 학습 데이터 세트는 Feature와 Target 값으로 구성되는데, 문장에서 60KG이라는 결과값을 추출해내서 Target값을 만들어야 합니다. (물론 이미 학습된 데이터 세트가 있다면 얘기는 다릅니다만)

이게 AI이든, 그렇지 않든, 풀고자 하는 문제영역을 먼저 정의해야 합니다. 가령 특정 문장이 부정적인지/긍정적인지 파악을 한다든가, 해당 문단이나/글이 특정작가가 만든 글인지, 또는 특정 뉴스가 어떤 카테고리에 속하는지, 아님 특정 웹사이트글이 가짜 뉴스인지, 또는 한국어를 영어로 번역한다든지입니다. 이렇게 문제 영역이 정의되면, 해당 문제와 답을 학습할 수 있는 데이터 세트가 있어야 합니다(사실 지도학습은 학습 데이터 만드는게 매우 큰일입니다)

먼저 고민이 되시는 문제 영역을 함 다시 정의하시고 그 부분을 어떻게 AI로 풀어낼지 생각해 보시는건 어떨지요? 답이 아니라면 다시 글 업데이트 부탁드립니다.

감사합니다.