인공지능과 추천 시스템 강의 노트 - (15/16) - 2024. 12. 13.
들어가며
마지막 두 주는 한국에서 대면으로 진행해야 겠다 싶어 한국에 들어왔지만, 계엄/탄핵 정국에 여의도에 in-person 수업이 어떤 의미가 될 것인가 등의 고민 끝에 남은 두 주는 아래의 결정들을 하였다.
수업 진행은 여의도 강의실에서 조교와 진행하지만, 학생들은 온라인 혹은 녹화 시청 허용.
기말 과제 발표 내용들은 사전 녹화한 내용을 취합해서 강의실에서 플레이
월요일부터 공지를 했지만, 갑작스런 변화에 발표하는 학생들이 혼란을 같이 나눠 준비하는 상황이 되었고, 연말 연시에 일정 조절은 이래저래 많이 어려운 상황이다. 녹화된 영상들로나마 학생들이 수업을 통해서 같이 고민 거리들을 나눌 수 있으면 하는 바램이다.
15주) 강의 update
구글 딥마인드가 에이전트 시대에 ‘제대로’ 반격해 보겠다는 메시지와 전방위적으로 12개의 토픽을 announce 하기 시작하는 openAI. 비슷한 듯 다른 여러 개의 새롭고 끊임없는 메시지들. 아울러 각각의 비지니스들은 아랑곳하지 않고 고유한 부분에서 혁신과 발전을 이루어 나가고 있겠다.
기말 과제들
당신을 위한 맞춤 부동산 경매 - 추천 시스템으로 만드는 사용자 경험 - 이송희
부동산 경매 물건 맞춤추천 서비스가 기획 및 개발된 과정과 개선 과정 등에 대한 내용들을 설명. 유료 구독 사용자들을 계속 유지할 수 있으려면 어떤 추천 로직들이 유의미할까에 대한 안팎의 다양한 고민들.
Q. 한 번 구매한 사용자가 다시 오게 되는 제품일까요 ?
Q. 구매까지 이루어지기를 기대하는 건 너무 끝까지 가는 걸 원하는 게 아닐까요 ? 그 이전의 이벤트들로 의미를 찾아야 할 거 같은데요..
Q. Interaction 에서 보여 주었는데, 클릭을 받지 못한 것들에 대한 처리가 필요해 보이는데요. 보여 주었지만 사용자가 관심 없어 하는 것들을 찾아서 모아야 하지 않을까요?
Q. 추천의 정확도를 어떻게 정의하고 구현하고 싶을까 문제가 일단 거리가 많이 멀어 보이는데… 정확도로 나와 있는 21%는 어떤 식으로 구했을까요 ? 설문조사의 별점인가요 ?
메타버스 기반의 로보어드바이저 자산관리 서비스-김수현
메타버스도, 로보어드바이저도 쉽지 않은 주제이지만, 이 둘이 합쳐지면 어떨까 하는 것에 대한 과감한 기획서. 질문들이 조금 공격적인 거 같아서 미리 양해를 구함.
C. 로보어드바이저도 레벨이 있었던 거 같은데요.. 돈을 알아서 굴려주는 서비스부터 그냥 정보들만 전해 주는 것까지.. ETF 가 아니고서는 거의 모든 경우 rebalancing 에서 승부가 나게 되고, 이들과 차별이 필요하거나 될까요 ?
Q. P10 의 로보어드바이저 업체들은 괜찮나요 ? AIM, Fount 등은 잠깐 반짝 하다 심하게 사라졌고, 금융권에서는 보이지 않게 숨어 있는 기능 정도의 위치일 텐데요…
Q. 한계점을 이야기할 때 현재 시점으로 메타버스도, 로보어드바이저도 각각 한계가 있는 서비스이고, 서로가 킬러 케이스가 되지 못하면 상상 속에서의 one-of-them 이 되기 쉬운데, 개인적인 의견으로 tipping point 가 있을까요 ?
Q. 메타버스는 매일 보고 싶은 성격의 서비스이고, 로보어드바이저는 아주 가끔 생각나는 서비스라 시너지가 쉽지 않아 보입니다. 어떻게 극복할 수 있을까요 ?
Intraday Prediction for the Korean Futures Market: Meta-model Stacking of Attention-based CNNs and Reinforcement Learning-이동원.pdf
코스피200 지수선물 예측 시스템 기획. 사람이 지표를 시각적으로 보고 예측하는데에 기반해서 ML 에서 시각적으로 접근하려는 노력을 코스피200 지수선 예측에 적용해 보는 구현과 논문. 상승 혹은 하락만을 예측해서 강화학습으로 보강하는 방법론. 불확실한 미래와 over-fitting 과의 싸움.
Q. 지난 주에 보았던 과제와 비슷한 접근이네요. 그래프 하나만 놓고 잘라서 분석해서 예측하는 건가요 ?
Q. 5분 후를 예측하는데, Accuracy 를 어떻게 구하는 건가요 ? 높음과 낮음만 챙기는 건가요 ? 그 경우 0.5 가 random 이고, 0.7 정도가 쓸만한 예측이라 하는데…
Q. P19 이후에 강화학습, Meta-model Stacking 등으로 비약이 있어 보이는데, Meta-model Stacking 에 대해서 간단히 소개 해 주시겠어요 ?
Q. P22 에 사용한 데이터들은 pure random 인가요 ? 아니면 KOSPI200 과거의 데이터들인가요 ? 너무 한쪽의 데이터들을 쓰고 있는 건 아닐까요 ? 그래도 시나리오별로의 예상 수익들이 높아진 게 확인되면 괜찮은 걸까요 ?
Job Recommendation Chatbot-박현진,이이담,홍성근
Indeed 의 내용들을 이용해서 custom 으로 RAG 를 만들어서 운용해 보면서 실제적인 내용들을 담는데, 자연어를 입력으로 하는 서비스를 만들어 보는 내용들. 서비스 초기의 MVP 를 만들어 보는 것으로 발표 내용들 정리.
Q. indeed 의 내용들을 무단으로 가지고 오는 모습인데 테스트 정도로는 괜찮았을까요 ?
Q. RAG 이, vectorDB 가 말을 잘 듣던가요 ?
Q. Accuracy 는 무엇을 어떻게 판단한 건가요 ?
Q. 챗봇에서 사용자의 질문은 어떻게 파악하게 되나요 ? 질문 자체가 친절하지 않을텐데요..
Direct Indexing, 초개인화 시대의 새로운 투자 패러다임-차혜민
투자자 및 개인이 본인의 투자철학을 반영. 테마, 업종, 지수 등을 대상으로 지수(포트폴리오)를 직접 구성하는 것을 다이렉트 인덱싱이라고 정의하고, 이를 어떻게 만들면 좋을지에 대한 여러 고민들.
Q. 개개인이 각자의 포트폴리오를 나름대로 꾸미는 것과 차이점이 있을까요 ? 기존의 ETF 같은 상품들과 차별화되는 부분들이 있을 수 있을까요 ? e.g. 내가 짠 포트폴리오를 남과 공유할 수 있다거나..?
Q. 포트폴리오를 구성할 때 '가장 좋은 주식들은' 은 초개인화와는 반대 방향의 것이 아닐까요 ?
금융기관의 AI를 활용한 디지털 전환 소개-김영진
도메인을 책임지는 제품의 관점에서 다양한 AI 의 시도를 해 보려는 노력들. 특히 잘 보이지 않지만, 산업은행의 최근 OpenAI 와의 MOU 에서 보듯 업무 수행의 도구로서 사용하는 내용들에 대한 다양한 접근들.
Q. p6,7에 지금 핫한 주제로 'AI agent' 가 보이지 않는 아랫단에서 일들을 막 시작하기 시작하지만, p8-p10 의 사례들은 꽤 오랫동안 써 오던 persona 를 약간 심은 말 잘 듣는 챗봇에 해당해서 아직 AI agent 라 불리기 이전 시기의 제품들인 거 같습니다.
Q. 뒷부분의 사례는 아주 좋네요. 도구로서의 역할을 제대로 해 주는 걸로 좋은 사례로 읽힙니다.
Q. 산업은행에서 ChatGPT를 열심히 쓴다는 이야기는 꽤 전부터 들어 왔었는데, 최근에 보도된 OpenAI 와의 MOU 도 관련이 있는 것일까요 ?
카카오뱅크 ‘오늘의 mini 일기’ 서비스-김민석
카카오뱅크에서 10대들에게 어필하는 제품인 ‘mini 일기 서비스 기획 및 개발기 소개. 여러 생성형 AI 를 이용해서 일기를 자동으로 만들어 주는 것에 대한 노력들. 실제 사용자 수까지 늘었다니 좋은 제품의 사이클인 듯하고.. 생성형 도구가 제대로 된 역할을 하는 것인 듯.
Q. 데이터 전처리 과정에서 결제 분류, 내역 등이 주는 모호함 때문에 사례 같은 많은 엉뚱함이 생길텐데, 이 부분은 가맹점 이름과 분류를 보완하는 방식으로 수행하신 건가요 ? 이 노력 자체가 비단 이 제품보다 더 많은 곳에 쓰일 수 있을 거 같은데요..
Q. 동일한 프롬프트에 두 다른 모델을 성능으로 비교하는 건 비교가 잘 되는데, 생성된 일기의 품질은 어떻게 비교를 한 것일까요 ?
Q. DAU , 카드 결제 건수 증가의 모수는 이 카드 사용 대상일까요 ? 아니면 전체 사용자 숫자일까요 ? 카드 결제 증가까지 연결되는 게 설명이 되는 거면 좋은 사례네요.
온라인 쇼핑 큐레이팅 모델의 한계 분석과 해결방안 제시-박종훈
쇼핑 몰에서의 각종 개인화 시도를 문제점으로 정의하고, 정보 과잉에 따른 쇼핑 피로도 증가 등을 풀어야 할 문제로 정의. MD 혹은 큐레이터들의 도움을 제품에 선택 가능한 영역으로 놓아 초개인화의 반대로 접근하려는 노력들.
C. 아슬아슬하군요. Curation block 이 가지는 한계 ( business vs 광고 ) 를 극대화하는 느낌이긴 하네요. 마치 코스트코가 생각나는 전략입니다.
C. 예전 구글 플레이 때 경험으로는 소위 ‘선택되지 않은’ 업체의 입장에서 여지를 피할 수 있는 친절한 블럭 설명이 생각보다 많이 중요했던 거 같습니다.
XBRL 공시 솔루션 - 최근일
기업들의 공시제도에 XBRL 을 의무적으로 이용하도록 되어 있는데, 이 자료들의 생성이 여러 모로 어려워서 이를 풀려는 노력들. 실제 동작하는 제품을 만들어서 공시 자료를 만드는 데 도움을 주려는 제품.
Q. 기업의 규모와 업종에 따라 공시의 의무들이 다르고, reporting language 라고 하지만 어마어마한 legacy 와의 싸움에 검수하는 노력들도 만만치 않을텐데..의무화로 해결이 될까요 ?
Q. 상장 기업 정도의 큰 회사는 이미 다른 자료들이 많을테고, 작은 규모의 기업들은 그림의 떡에 해당하지 않을까요 ?
맺으며
저녁 내내 들리던 집회 소리들과 때마침 울려 퍼지기 시작하는 이승환의 탄핵 콘서트. 수업이 끝난 10시 이후 멀리 보이는 국회와 모여 있는 사람들. 복잡한 생각이 드는 하루하루인데, 다음 주는 마지막 수업 시간이라 조금 더 복잡하다.
출처 : 브런치 매거진 KAIST DFMBA 2024
https://brunch.co.kr/@chaesang/100 ( 2024. 12. 13. )
댓글을 작성해보세요.