블로그

윤선미

데이터 분석가 로드맵 🥳 & 데이터리안 강의 실제 학습 시간 공개

✨ 데이터리안에서 분석가 로드맵이 나왔습니다 ✨ 그리고 인프런 대시보드가 리뉴얼 되었어요. 이제 학생들이 이 강의를 학습하는데 실제로 얼마나 시간을 소요하고 있는지 볼 수 있게 되었습니다! (예시. 기초 SQL강의의 런타임은 1시간 36분, 실질 수강 기간은 3일!) 로드맵을 소개하면서, 데이터리안 강의를 학습하는데 우리 수강생 분들이 어떻게 시간을 쓰고 계시는지 같이 얘기해보겠습니다.    1. SQL 실무 활용 트랙 기획자, 마케터 등 SQL을 실무에서 활용해야 하는 모든 직군이 공통으로 들을 수 있는 구성입니다. 간단한 데이터를 추출하거나, 기존 쿼리를 이해하는 등 라이트하게 활용할 사용자들을 위한 트랙입니다. 강의의 순수 플레이 타임은 기초 SQL 1시간 36분, 중급 SQL 4시간 19분으로 5시간 55분이고, 중급 SQL 문제풀이 강의 2시간 12분을 포함해서 학습하신다면 8시간 7분입니다. 실제 학습에 소요되는 시간은 어느정도 될까요? 강의를 90% 이상 수강한 학생들이 '완강 수강생'이라고 생각하고, 이 수강생들의 상위 50% 평균을 계산한 값은 다음과 같습니다. 기초 SQL은 3일, 중급 SQL은 9일, 중급 SQL 문제풀이는 4일을 소요하여 강의를 완강합니다. 하루에 약 30분 정도 투자해서 공부를 하고 계시구요. 데이터리안의 모든 코스의 강의는 평균 10분 내외로 촬영하고 있으니까 하루에 약 3개 강의 정도 들으시는 것으로 예상해볼 수 있겠네요 😊 그런데 수강평을 보면 아시겠지만, 기초 SQL의 경우 런타임이 약 1시간 30분 정도라서 하루만에 몰아서 끝내시는 분들도 많아요. 이 강의를 활용해서 학생들을 가르쳐본 경험으로는 약 3시간, 길면 5시간 정도 집중하는 시간을 내면 기초 SQL 강의를 완강하실 수 있습니다. 본인 스타일에 맞게 하루에 몰아서 빡공! 또는 매일 30분씩 나누어서 공부하면 좋겠죠. 👉 데이터리안 수강평 모아보기    2. 데이터 분석가 트랙 현업에서 데이터 분석가로 일하고 계시는 분 또는 데이터 분석가로 입사하기 위해 코딩 테스트를 준비하는 분들을 위한 구성입니다. SQL로 데이터를 자유자재로 핸들링하고 분석에 활용할 분들을 위해 고급 SQL 강의가 들어가있고, 분석을 위한 추가 스킬로 파이썬이라는 프로그래밍 언어를 선택하신 분들을 위한 트랙입니다. 강의의 순수 플레이 타임은 SQL 실무 활용 트랙에 더해, 고급 SQL 5시간 16분 + 파이썬 입문 8시간 55분 + 판다스 6시간 30분으로 총 20시간 41분이 추가됩니다. 여기에 고급 SQL 문제풀이까지 학습하신다면 2시간 12분이 더해져 총 플레이타임은 22시간 53분이 됩니다. 실제로 수강하는데 걸리는 기간을 보면 고급 SQL은 16일, 고급 SQL 문제풀이는 4일, 파이썬 입문편은 4일, 판다스는 22일이 걸리고, 하루에 평균적으로 20분~30분 정도 투자하고 있어요. 파이썬 입문 강의는 특이하게 하루 평균 시청 시간이 2시간 30분이나 되는데요. 강의 러닝타임에 비해서 완강까지 걸리는 기간도 매우 짧구요. 아직 런칭한지 얼마 안 된 강의라서 그런 것인지... 정말 파이썬 입문 강의에는 🔥열혈 수강생🔥들만 있는 것인지 데이터 추이를 지켜보고 있습니다. 데잇걸즈 4기, 5기분들도 데이터리안의 SQL 강의를 수강하셨었는데요. 적절한 코칭이 함께 들어갔을 때 또는 스스로 꾸준히 학습할 때 기초 SQL부터 고급 SQL까지 학습하는데 걸리는 시간은 약 4주에서 8주정도 된다고 생각하시면 좋을 것 같아요. 개인차가 있지만 아무리 늦어도 8주안에 SQL 코딩테스트를 통과할 수 있는 정도의 실력은 길러진다고 보고 있습니다. 실제로 네이버, 리디 등의 데이터 분석가 코딩테스트에 합격하신 분들이 연락을 많이 주시구요. 데잇걸즈 같은 1년에 한 번 있는 프로그램이 아니더라도 함께 모여서 으쌰으쌰하며 공부할 수 있는 환경이 만들어지면 좋을 것 같다는 취지로 4주에서 8주짜리 SQL 캠프도 기획하고 있으니까 기대 많이 해주세요. 👉 데잇걸즈 4기 수강생 분들의 기술 블로그 보러가기 "SQL? 누구냐 너!!"    3. 데이터 사이언티스트 트랙 이 트랙은 파이썬이라는 프로그래밍 언어와 머신러닝🤖을 공부하고 싶은 분들을 위해 구성했습니다. 강의 런타임과 실질 수강 기간은 아래와 같아요. 데이터 분석을 위한 파이썬: 러닝타임 8시간 55분 / 4일 / 매일 2시간 33분 학습 데이터 분석을 위한 판다스: 러닝타임 6시간 30분 / 22일 / 매일 21분 학습 추천 시스템 입문편: 러닝타임 7시간 49분 / 12일 / 매일 41분 학습 총 러닝타임은 23시간 14분, 학습 기간은 38일이네요. 앞에서도 말했지만 파이썬 입문 강의의 일일 학습 시간, 학습 완료까지 걸리는 기간 데이터가 참 특이합니다 🤔 '데이터 분석을 위한 판다스' 강의의 런타임이 6시간 30분으로 훨씬 짧은데도 실질 수강 기간은 훨씬 길죠. 판다스 강의에 분석 프로젝트가 많아서일까요. 데이터를 눈여겨 봐야겠습니다. 👉 데이터 분석을 위한 파이썬: 입문부터 꿀팁까지 보러가기   4. 수강 완료 기간 데이터 데이터리안 강의들의 런타임, 실질 수강 기간, 1일 평균 시청 기간 데이터를 정리해보면 아래와 같습니다. 이 데이터는 고정된 데이터가 아니라 여러분들의 강의 수강 패턴대로 계속 업데이트 될거예요. 강의 완료기간은 더 짧아지도록, 1일 평균 시청 시간은 더 길어지도록, 그리고 완강하는 사람들의 비율이 더 늘어나도록 저희도 노력하겠습니다. 👉 데이터리안 전체 강의 보러가기👉 데이터리안 서비스 페이지 바로가기   (2021년 11월 5일 기준) 강의명 러닝타임 완료기간 1일 평균 시청 시간 로드맵 [백문이불여일타] 데이터 분석을 위한 기초 SQL 1시간 36분 3일 32분 SQL 실무 활용, 데이터 분석가 [백문이불여일타] 데이터 분석을 위한 중급 SQL 4시간 19분 9일 29분 SQL 실무 활용, 데이터 분석가 [백문이불여일타] 데이터 분석을 위한 중급 SQL 문제풀이 2시간 12분 4일 33분 SQL 실무 활용, 데이터 분석가 [백문이불여일타] 데이터 분석을 위한 고급 SQL 5시간 16분 16일 20분 데이터 분석가 [백문이불여일타] 데이터 분석을 위한 고급 SQL 문제풀이 2시간 55분 4일 44분 데이터 분석가 데이터 분석을 위한 파이썬: 입문부터 꿀팁까지 8시간 55분 4일 2시간 33분 데이터 분석가, 데이터 사이언티스트 데이터 분석을 위한 판다스: 기초부터 블로그 GA 데이터 분석까지 7시간 47분 22일 21분 데이터 분석가, 데이터 사이언티스트 [개념부터 실습까지] 추천 시스템 입문편 7시간 47분 12일 41분 데이터 사이언티스트  

데이터 사이언스데이터분석로드맵데이터리안SQL파이썬데이터사이언스분석가머신러닝추천시스템

인공지능과 추천 시스템 강의 노트 - 2025.10.4(5주), 2025.10.10(6주)

2025.10.4. / 2025.10.11들어가며학기 초부터 예상을 한 것이긴 하지만, 대체 휴일을 포함하며 매우 긴 추석 연휴가 주어지며, 토요일 수업을 진행하는 입장에서 꽤 난감한 상황이 되었다. 토요일에 수업을 배정할 때부터, 소위 빨간 날인 휴일은 아니지만 그렇다고 열흘 연휴 중 두번이나 여의도에 등교하는 것을 강제하는 게 적절한가 등의 고민이었고.. 나도 개인적으로 명절을 한국에서 보내기 여의치 않은 상황이어서 두 번의 강의를 온라인으로 진행하는 것으로 하기로 하였다.그래도 라이브 유튜브 하는 것처럼 댓글도 달리고 하면 좋겠다는 생각을 했지만, 미국의 금요일 밤 11시나 한국의 오후 3시나 여의치 않은 상황이어 녹화 영상을 송출하는 방식으로 진행했다. 팟캐스트 등의 댓글로 서로 궁금한 걸 나누면 좋을텐데, 이건 내 역량의 한계인가 싶기도 하다.같이 보면서 이야기나눌 수 있는 내용들을, 한편으로는 가볍게 보았으면 하는 마음으로 링크들을 공유했는데, 수업의 특성 상 반강제로 끝까지 보아야 출석 인정이 되게 되었다. 기왕이면 이전에 보지 않은 클립들이면 싶고, 흘려 듣더라도 내가 받았던 감동을 받으면 좋겠다는 생각이다. 이번 글은 나누었다기보다는 그냥 준비한 내용들을 흘려 보낸 에 가깝고, 후속으로 나누고 싶은 이야기들은 언제든지 환영한다. 준비한 내용들 - 5주5주) 강의 updateSearch by GoogleGoogle — 25 Years in Search: The Most Searched ( 2024, 4min )Google — Year in Search 2024 ( 2024, 4min ) The Evolution of Search ( 2011, 6 min )How Google makes improvements to its search algorithm ( 2011, 4 min )Search Quality Meeting: Spelling for Long Queries (Annotated) ( 2012, 8 min ) Google Instant Launch Event ( 2010 , 1h 26m ) - Google Instant ( 15 ~ 52, 37min )Inside Search Event ( 2011, 59 m ) - Google instant pages , ( 0 ~ 23, 10 min ) Google I/O 2015 - Smarter user acquisition with App Indexing, AdWords and Google Analytics (2015, 20 min ) 5번째 주는 구글 검색에 대한 내용들을 모았다. 개인적으로 일에 관련된 모든 것들을 좋아하던 시절의 이야기들이고, 기술적인 챌린지들도 내용도 꽤 아는 이야기들을 press event 로 녹여 내던 시기의 이야기들을 주로 담았다. 개인적으로는 search quality review meeting 이 밖으로 더 널리 알려지면 하는 바람도 있고, 자주는 아니지만 google I/O 에 검색팀이 나가야만 했던 그 시절 상황도 알려지면 하는 생각이다. 이후의 Google I/O 이벤트들은 전문가들의 손길이 다양한 데서 닿았던 거라 그시절의 낭만은 더이상 없는 듯해서인지 그래서 좋은 기억으로 남아 있는 거 같다. 준비한 내용들 - 6주AI until 2025Ted Talk : How we're teaching computers to understand picturesby Fei-Fei Li ( March 2015 , 18 min )Ted Talk : How AI could empower any business by Andrew Ng ( April 2022, 11 min ) Ted Talk : Why AI is incredibly smart and shockingly stupid by Yejin Choi ( April 2023 , 16 min )Building AI for Everyone | Jeff Dean Senior Fellow in Google AI ( 2018, 세바시 강연, 16 min ) The future of computing: a conversation with John Hennessy (Google I/O '18) ( May 2018, 25 min )Jeff Dean (Google): Exciting Trends in Machine Learning ( 2024, 70 min ) 6번째 주는 AI 관련된 몇몇 talk 들을 역시 사심을 담아 공유하였다. AI 쪽으로 발을 디딜 때 접하게 되었던, data driven 의 세상을 접하면서 알게 된 감동을 하나씩 공유하려 주고 싶었지만, 요즈음의 AI 는 그당시 쥐어 짜던 시절의 ML/DL의 조금은 수줍던 접근이 더이상 아닌 거 같아 살짝 아쉬운 부분이 있다.구글에 10여년 다니며, 지금은 전직장 동료(?)가 노벨상을 받았다는 억지스런 자랑거리도 있다지만, 말로만 듣던 대가들을 살짝 가까이에서 볼 수 있었던 것에 대한 감동, 또 그들이 자기자신들의 한계를 넘는 모습을 접할 때 큰 울림이 있어 왔다. 물론 그들의 한계라는 것조차 내가 임의로 그린 것이겠지만… 그 중 몇몇은 지금 보아도 전율이 이는데, 살짝 길지만, 그 중 두명의 이야기를 나누고 싶었다.하나는 2018년 google I/O 때 John Hennessy 옹(? 님?)께서 훑어 주신, 컴퓨터 구조에서 시작한 ML / domain specific programming 에 대한 이야기로, 마치 지금의 transformer 지배적인 세상을 예측한 듯한 대가의 말씀, 그것도 엄청나게 열정적인 자세로… 진정 저렇게 나이 들고 싶다는 생각을 했었다. 다른 하나는 Jeff Dean 의 구글 AI/ML summary. 당시 Brain 팀의 수장이었지만, 그 누가 이토록 꿰뚫는 이야기를 할 수 있을까, 그리고 그걸 듣는 입장에서 수긍할 수 있을까 등의 감정으로 보았던 내용들이라 하겠다. 제품과 기술 둘 중에서 꽤 많이 기술 이야기이긴 하지만, 기술자 identity 인 나의 시각에서 수업에 지장이 안 간다면 꼭 나누어 주고 싶은 이야기들이 클립들에 담겨 있다 하겠다. 약간의 사족구글에 조인할 때 founder, celebrity 들을 보고 선택을 한 건 아니었지만, 이후에 내가 tech 회사를 차린다면 혹은 조인한다면 Jeff Dean 혹은 Craig Silverstein 같은 사람을 회사 내에서의 코드나 업적으로 만나길 바라게 되었다. 이후에 나타난 회사를 옮겨 다니는 네임드들을 접할 때, 이들이 구글에서 이루어 낸 '업적'을 고려해 보게 되는데, 훨씬 더 다양한 일들이 있게 되는 복잡해 진 요즘 세상에, 특히 engagement 를 고민하게 될 때 그 시절의 낭만은 꽤 그립다.

대학 교육 기타인공지능추천시스템

추천 시스템, 학계도 기업도 열광하는 이유는?

지금, 온라인 서비스의 성공은 어떤 요소에 좌우될까요? 추천 시스템에 바로 해답이 있습니다. 유튜브, 넷플릭스, 아마존, 스포티파이 등의 초대형 테크 기업에서 추천 시스템을 통해 사용자 맞춤 콘텐츠를 제공함으로써 폭발적인 성과를 거둔 바 있죠. 데이터를 효과적으로 분석하고 경영 전략에 활용하기 위해 전문가 채용 또한 활발해졌습니다.추천 시스템을 이루는 알고리즘을 구현하기 위해서는 파이썬(Python) 기반 머신러닝을 알아야 합니다. 현재 가장 인기 있는 프로그래밍 언어 중 하나인 파이썬은 여러 머신러닝 라이브러리를 통해 추천 시스템 구현에 필요한 기능을 지원합니다. Scikit-Learn(사이킷런) 같은 라이브러리가 대표로 꼽히죠.꼭 비즈니스가 아니더라도 파이썬 기반의 추천 알고리즘 구현 능력은 매우 중요합니다. 복잡한 데이터를 분석하고 예측하기 위해 그 활용 범위가 더욱 넓어지고 있기 때문인데요. 추천 시스템을 통해 보다 정확하고 효율적인 결과를 얻을 수 있도록 알고리즘을 고도화하고 핵심 라이브러리를 잘 활용하는지가 경쟁력으로 주목받고 있는 요즘입니다.•••추천 시스템에 필요한 파이썬과 선형대수, 머신러닝 라이브러리 활용 모두 알아보고 싶다면?지금 인프런 프리즘 [파이썬 머신러닝 추천 시스템 입문 로드맵]을 통해 학습해보세요. https://www.inflearn.com/roadmaps/704•••인프런 프리즘 브랜드 스토리 읽어보기 >>

데이터 사이언스머신러닝추천시스템추천알고리즘파이썬Python선형대수선형대수학Scikit-Learn인프런프리즘InflearnPrism

인공지능과 추천 시스템 - 마치며

들어가며 2025년 2학기 KAIST 경영대학원에서 Digital Finance MBA 과정에서 개설된 ‘인공지능과 추천시스템' 강의를 마쳤다. 3학점 16주의 일정이 끝났고, 지난 두 번의 느낌과는 또 다른 추가적인 아쉬움들이 든다.이번에도 금융의 영역과 문제 풀이의 본질인 공학의 테두리 안에서, 인공지능과 추천이라는 주제를 다른 트랙처럼 운용하려 했고, 제품과 서비스로서의 문제 정의와 풀어 나가려는 접근 등을 같이 고민하려 했다. 과목의 이름이 주는 방대함과 위압감은 지난 학기들 이상이었고, 변화하는 시대의 이슈들을 따라가고자 하는 게 버거움이 많았다. 준비한 것들교재 같이 읽기 - 박태웅의 AI 강의교재 같이 읽기 - 추천 시스템 입문코드 따라 하기 - MovieLens , 추천 알고리즘 - 기본 구현들 , 복잡한 구현들특강 - stateof.ai 2025특강 - Google(Playstore)에서 과제 런칭하기특강 - Search Quality with Google특강 - 실전에서 만나는 이슈들-데이터 기반 의사 결정, 서비스 설계 개발, 운영과 모니터링특강 - 인이지와 Digital Transformation with XAIㅏ기말 발표 주제 선정, 발표 자료 리뷰, 발표 리뷰추석 맞이 클립 모아 보기 Stat 들56명의 수강생4번의 remote 수업55개의 EDA 중간 과제, 44개의 기말 과제1번의 간담회 형식의 치맥 작년과 달랐던 점들토요일 오후 수업. 16주간 여의도로 토요일 오전 출근, 저녁 퇴근.공개적인 자료를 가지고 진행한 EDA 중간 과제들 추가강의 계획서부터 예고를 꽤 했었지만, 과목 이름에 대한 기대 때문에 편차가 심한 건 감내해야 했을 테고, 학생들의 리포트 내용이나 발표 내용도 아예 처음 보는 사람부터 거의 다 아는 사람들까지 편차가 커서 아쉬움이 많았다. 토요일이지만 물리적으로 하루 종일을 할애했었지만, 막상 학생들과 기억나는 interaction들이 많지 않은 것도 아쉽고, 내용들도 중구난방의 형태로 받아들이는 친구들이 많았다. 학기 초 한두번 수업 시간에 이야기를 했더랬지만, 끝까지 전달되지 않는 건 정말 내 문제만이었을까 싶은 생각까지 든다.중간 리포트와 기말 보고서의 품질이나 깊이 등이 작년 대비 많이 낮아졌다는 생각이다. 파트타임 MBA 라서 사정을 너무 봐 주어서인지 보고서들이 연말에 너무 몰리고, 복잡한 개인 일정 때문에, 피드백 자체를 몇 번 주지 못한 상태가 되었고, 그 결과가 전반적인 품질의 저하로 나타났다는 생각이다. 보고서들은 딱 보기에도 AI 들이 절반 이상은 만들었다는 생각이 들 정도이고, 그 행간을 읽어 보려 노력했지만 많이 힘겨웠던 시간들이었다.아울러 한학기를 통틀어 커피챗을 신청한 학생은 단 두명, 학생들의 질문은 다섯 손가락 안이었고, 같이 참여를 했으면 하는 공동 문서에 서로의 과제들에 대한 질문과 대답에 반응하는 학생들은 열명 미만이었다. 다른 레퍼런스가 없어 이렇게 질문들이 없는 걸까 싶기도 한데, 옆의 교수님께서는 매 수업 '내가 열심히 참여하고 있다'는 증거를 포스트잇에 써서 내라고 해서 점수화 시키시던데, 가르치는 사람과 배우는 사람 등의 방법 들에 대해 고민이 더 필요하다 싶다. 점수 매기기학과에서 준 몇가지 가이드가 있었고, spreadsheet 에 출석과 항목들을 체크했었지만, 이번에는 gemini 와 chatgpt 의 도움을 받아서 배점을 정했다. 아래는 사용한 스크립트. 배점을 설정하고 계산하는 데 유용하게 사용했다. ---60명이 듣는 과목을 성적을 매기려고 해. 아래의 기준들을 가지고 100점 만점의 평가표를 만들고 싶은데.. Spreadsheet 의 공식으로 만들고 싶어. 일단 출석+태도 50% , 중간 15% , 기말 35% 비중이고100점 만점으로 변환한 후에는 A+ = 4.3, A0 = 4.0, A- = 3.7 등으로 놓고평균으로는 어지간하면 3.7 정도를 놓고 싶어 16번의 수업에 24번의 출석 체크가 있었는데, 하루에 최대 2번 체크를 했어서 결석일수가 2개면 수업 하나를 안 들은 거야. 중간 과제는 리포트를 쓰는 과제인데일정을 잘 지켜 리뷰를 잘 받았는지 ( yes / no )기간 내에 제출을 잘 했는지 ( yes / no ) - no 는 late코드와 리포트의 양식을 지켰는지 ( yes / no ) - no 는 정리 정돈 안 됨.데이터를 분석의 난이도 ( A / B) - A 가 어려운 것들코드 있음 or graph ( yes / no ) - no 는 양이 부족해추가적인 제안한 게 있는지 ( yes / no ) - yes 는 조금 더 챙겨 주고 싶어.과제를 안 낸 학생은 하나가 있어 기말 과제는 15-20분 발표를 시켰어.일정을 잘 지켜 리뷰는 잘 받았는지 ( yes / no )기간 내에 제출을 잘 했는지 ( yes / no ) - no 는 late피드백을 반영했는지 ( yes / no )발표 시간은 잘 지켰는지 ( yes / 살짝 초과 / 많이 초과)영상의 품질은 어떤지 ( yes, no )추가적인 감동이 있는지 ( yes ) bonus논문 분석 , 타사 제품 설명 , 제품 기획 중 하나를 고르는데논문 분석은 논문 하나의 분석 이외의 견해가 있는지 ( yes, no )타사 제품 설명은 데이터 분석이 포함되었는지제품 기획은 조금 harsh 한데 타겟이 명확한지 ( yes / no ) , User study or data 가 있는지 ( yes / no ), Prototype을 실제 구현을 했는지 ( yes / no )  마무리하며강의 평가 결과는 작년보다도 낮은 점수들이 나왔다. 꽤 실망스러운 점수여서 추스리는 데 에너지가 많이 든다. 리모트 몇 번이 어중간했고, 추석 등의 어중간한 시간에 이용하려 한 온라인 방송 송출과 대가들의 강의를 소개한 것들에 대해 부정적인 점들이 몇 있었다. 물론 날 선 피드백들과 더불어 새로운 시각들을 알게 되었다는 피드백들도 있었던게 위안이 되었다.원래의 취지와 달라져 버린 과목의 이름과 상대적으로 더 old 해 져 버린 개발 세상의 이야기들은 올해 정도까지일 거 같다. 내년 아니 올 가을에 어떤 내용들을 이 과목에 담을 수 있을지 학과 교수님들과 진지하게 고민하고 이야기 나눌 예정이다. 

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (16/16) - 2025.12.20.

들어가며마지막 수업은 제출된 기말 과제들 중 여럿을 같이 보는 것으로 마무리를 지었다. 시간을 따로 잡았어야 했을까 하면서도 각 과제별로 나누었던 이야기들을 최대한 나누고 싶어 몇 개를 선정해서 진행했고, 그 결과로 마지막 수업은 조금 밋밋하게 끝이 나게 되었다. 준비한 내용들금융이 주가 되는 유명 AI 관련 학회는 없지만, AI 학회들에 꾸준히 workshop 한 세션들은 열리고 있어서 이들을 소개하는 것을 마지막 시간 소재로 이야기했다. 기말 과제들을 리뷰하며 몇 개는 진지한 논문의 형태로 가도 되지 않을까 생각도 했었지만, 여러 제약들이 가끔 아쉬울 때가 있다. 맺으며학점 제출 기간이 바로 있어서 연말까지 중간과 기말 과제를 채점해야 했고, 아래의 질문들을 적용했다.타임라인에 맞추어 리뷰들을 받았는가?제 시간에 제출하였는가?리포트의 형식을 갖추었는가?데이터와 분석하는 코드들을 같이 리뷰하고 있는가?추가적인 제안들을 담고 있는가?제안한 풀고 싶은 문제를 접근하고 있는가? 난이도는 어떠한가?각종 AI 도구들이 이미 가까이에 와 버린 세상에 현업에서는 혹은 수업에서는 어떤 의미들을 가지고 어디까지 적용해야 하는가 한 학기 내내 같이 고민하는 시간이었고, 각각의 도메인에서 해결할 수 있는 문제들과 해법의 형태로 세상을 이롭게 하는데 쓰이면 하는 바램이다.

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (15/16) - 2025.12.12.

들어가며강의장 사정으로 금요일 저녁에 수업을 진행하였다. 기말 과제를 녹화해서 발표 예정이었는데 제출된 양이 부족해서 이번 학기에 진행하고 있는 스탠포드 대학의 고수 교수님들의 강의들을 같이 보며 이야기를 나누었다. 준비한 내용들15주) 강의 update모든 플레이어들이 참여한 aaif.io 가 한편으로는 충격적이었다. 새시대의 foundation 으로 자리잡을 수 있을까 응원 반, 걱정 반의 마음이다.업권 전체, 직군 전체를 욕먹이는 사건이 발생했어서 내내 마음이 불편했다. 투자자의 입장에 조금 더 가까운 친구들이니 이런 것들을 잘 걸러냈으면 하는 바램으로 학생들에게 한소리 했더랬는데, 괜한 화풀이를 학생들에게 한 모습인 거 같기도 했다. 중간 과제 EDA report ( part 2 )IBM HR Attrition Analysis and Prediction디지털 연결성과 계좌 보유율 EDAKaggle 보험 이탈데이터 EDA학생 스트레스 예측 EDA 리포트Wine Quality Prediction음악의 장르/특성과 멀티플렛폼의 상관관계반도체가격 예측 EDA 및 결과분석요약서식당 방문목적X서비스만족도 상관성 분석FacebookAI-PersonaChat소셜미디어 사용과 개인 생산성의 관계 분석화물차 구입자금 대출의 채무불이행 요인 분석데이터 기반 고객 세분화: 연령과 소득이 소비 행동에 미치는 영향 분석Netflix 콘텐츠 데이터 EDADART 비재무 공시와 공시 시점 주가 반응 분석건강 요인이 보험금 청구액에 미치는 영향 분석고객 구매 행동 데이터를 활용한 구독 서비스 가입 예측 및 마케팅 전략 수립PUBG 초보 캠핑(존버) 전략의 순위(winPlacePerc) 영향: PSM 분석 보고서학생 성적 데이터 분석서울시 따릉이 대여량 예측신용카드 거래 이상거래 탐지아파트 경매 낙찰가 예측 EDA어떤 동물이 가족을 빨리 만날까뉴욕 숙박 공유 서비스 데이터 정합성 검증 및 운영 최적화 리포트Gold Price Time Series Data전 세계 행복도 결정요인 분석DART 공시 재무지표와 주가의 상관관계 분석공급망 데이터 분석호텔 예약 데이터를 활용한 예약 취소 가능성 예측 및 고객 유치 전략 제안한국 ETF EDA Report비디오 게임 산업의 흥행 결정 요인에 관한 연구글로벌 AI 직무 데이터 기반 핵심 기술(Hot Skill) 탐색적 분석Instacart Market Basket Analysis금가격 분석 및 예측 보고서Bitcoin개인대출 연체리스크 방지를 위한 예측시스템 준비한 대가의 강의들Deep learning 일반과 deep learning for computer vision 의 입문에 대한 최고수들의 최근 정리들 두 개를 보며 이야기들을 나누었다.Stanford CS230 | Autumn 2025 | Lecture 1: Introduction to Deep LearningStanford CS231N Deep Learning for Computer Vision | Spring 2025 | Lecture 1: Introduction FeiFei Li 교수의 강의는 컴퓨터 비전과의 역사에 해당하는 부분이 크다고 하겠고, Andrew Ng 교수님의 이야기는 현재와 미래에 대한 견해들이 많은데, 아래 두 그림의 요약은 내 생각과도 100% 닿아 있다. 맺으며연말의 정신 없이 어려운 일정들과 함께 학기 마지막에 몰아쳐지는 과제들은 매번 어렵고 버겁다. 과목이니 성적표를 받게 될테고, 학생들의 입장에서의 기대치와 그와 관련된 claim 들로 연말이 바쁘게 지나가게 될 거 같다.남은 다음 포스트들은 기말 과제 요약들과 마지막 강의 wrap up 등이 있겠다.

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (14/16) - 2025.12.6.

들어가며토요일 새벽에 공항에 도착했고, 간밤에 큰 눈이 왔다던 겨울의 서울 풍경이었다. 바로 여의도로 출근해서 이야기들을 진행했다.마지막 학기에는 학생들의 과제 발표를 나누는 시간으로 기획했었는데 시간이 비게 되어서 그 공간을 이번 학기 최근에 진행한 여러 대가들의 공개 강의들을 준비했다. 미처 준비가 되지 못한 시간들을 유튜브로 때우는 거 같은 미안함도 있었지만, 나름 돌발 변수가 생긴 상황에 어중간한 내용들을 보여 주기보다는 꽤 공들여서 최신의 의미 있는 내용들을 준비했다. 준비한 내용들14주) 강의 update여느 주와 다름 없이 다양한 영역에서 꽤 여러 일들이 일어난 한 주였고, Ilya Sutskever 를 비롯한 대가들의 다른 방식으로 AGI 에 접근하는 것에 대한 이야기들이 관심을 끌었으며, 은근히 SW 적으로 치고 나오는 NVidia 이야기들도 주목할 만하겠다. Stanford AI Club: Jeff Dean on Important AI Trends얼마전 Jeff Dean 이 구글에서 일어났던 프로젝트들 중심으로 AI trend 를 설명해 준 내용들이 담겨 있다. ‘내가 해 봐서 아는’ 것들 위주로만 모아 놓은 것인데도 깊이가 깊고, 덤으로 최근 Gemini 가 적용되는 제품들이 소개된다. 중간 과제 EDA report ( part 1 )Kaggle 등의 공개적으로 나와 있는 데이터들 중 일부를 골라 회사 상사 등의 관계자들에게 EDA 보고서를 쓰는 것을 개인 과제로 중간 과제로 놓았다. 각각 제한이 있는 데이터셋들이지만, 이들을 분석하는 과정에서 데이터들이 가르쳐 주는 내용들, 도메인에 대한 분석들을 꽤 잘 나누어 주는 내용들이었다. Syllabus 의 pre-requisite 에도 불구하고 몇몇 학생들은 처음 Python 을 접했지만, coding assistant 의 도움을 받든지, 구글링을 이용하든지 진행해 주기를 바랬고. 한계가 어떠한지, 분석하는 방법이 어떠했는지, 분석된 결과가 보고서의 형식이 어떠했는지 등을 피드백을 각각 주고 받았다. 각자 강점이 있는 도메인에 있는 내용들을 찾기를 이야기했고, 덕분에 많이 배우게 되었다. 아래는 학생들이 제출한 보고서의 제목들이다. Elon Musk 트윗 감정점수 및 트윗빈도가 Tesla 주가에 미치는 연관성 분석서울특별시 아파트 매매 실거래가(2016-2025) EDA 보고서사업자 등록 상호 데이터 분석 보고서스포티파이(이탈여부) 데이터카페인 섭취량이 건강에 미치는 영향도(상관관계) 분석전복나이 예측 EDA 및 회귀 모델링자동차 판매 데이터 분석럭셔리 뷰티 팝업 이벤트 성과 요인 분석 및 머신러닝 기반 예측 모형 연구학생 성적에 영향을 미치는 요인은 무엇이며,그중 가장 영향력이 큰 요인은 무엇인가한국 고속도로 톨게이트 통행량 기반 이동 흐름 분석데이터로 읽는 대구 부동산 시장: 입지와 시설 요인의 가치 분석고용형태에 따른 임금 격차 및 초과근무 구조 분석Loan Prediction Dataset EDA ReportStore Sale EDA Report2020년 시카고 대규모 폭동 이 도시 치안 시스템에 미친 영향 분석서울시 따릉이 대여량 예측 EDA 보고서주요경제지표(미국정책관련)에 따른 가상자산의 가격변화분석스타트업의 성공에 영향을 미치는 요인은 무엇이며, 그 중 가장 영향력이 큰 요인은 무엇인가 맺으며연말 여러 복잡한 일정과 함께 몰려 드는 과제 피드백들이 꽤 버겁지만 많은 걸 새로 알게 되어 소소한 기쁨이 있다. 하지만, 채점도 진행을 시작해야 하겠고, 정신 없는 12월이 될 거 같다.

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (13/16) - 2025.11.29.

들어가며 개인적인 사정으로 미국에서 온라인으로 진행하였다. 녹화 영상을 들으며 출석 처리가 되는 환경이라고 하면 그래도 조금은 가벼운 내용들이기를 기대하다가도 반대로 이참에 다른 데서 못 듣는 것들을 포함하자 싶은 서로 상반된 생각들이 있었다. 학기 초에 과목과 관련해서 준비한 내용들은 다 커버했고, 이번 시간에는 조금 더 일반적인 이야기들을 '실무에서 만나는 이슈들' 이라는 주제로 준비한 내용들을 상영하였다.아래는 시간차 어긋난 곳에서 진행한 미국 서부의 명절 스케치들.. 준비한 내용들13주) 강의 update알파고 이후에 알파스타가 스타크래프트 2 프로토스로 인간을 이겼다고 했는데, Grok 과 T1 과의 5:5 롤 대전은 그것대로 꽤 기대되는 게 있다. 실무에서 만나는 이슈들-강사 소개.pptx실전에서 만나는 이슈들-데이터 기반 의사 결정.pptx실전에서 만나는 이슈들-운영과 모니터링.pptx실무에서 만나는 이슈들-서비스 설계 개발.pptx 학기 시작하기 전에 녹화 영상으로 미리 준비해 놓았던 내용 중 마지막으로 아껴 놓았던 ‘실무에서 만나는…” 시리즈를 나누었다. 몇년 전에 FastCampus 에서 진행했던 “현실 세상의 컴퓨터공학 지식 with 30가지 실무 시나리오 초격차 패키지” 라는 강의 셋트( https://fastcampus.co.kr/dev_online_newcomputer ) 의 한 부분으로 준비했던 내용인데, 전공자의 시각에서 생각해 보니 필요했던 내용들 위주로, 비전공자가 이거라도 꼭 배워야 한다면 이라는 시각으로 준비한 내용들이었다. 굳이 금융으로 한정짓지는 않더라도 전공자들과 비전공자들이 일터에서 이야기하게 될 때 서로를 위해 알아 두면 하는 내용들을 모았더랬다. 다 합하면 5시간이 넘는 분량이어서 마지막 하나는 수업과 상관 없이 optional 로 시청할 수 있도록 하였다. 맺으며15분씩 발표 영상을 만들어 제출한 내용들로 이후를 구성할 예정인데, 숫자가 모자라면 그 시간들을 같이 나눌 이야기거리들이 더 필요하게 될 거 같다. 여전히 많은 일들이 벌어지는 세상이라 재미있는 배울 것들이 넘쳐나고, 한편으로는 연말에 리뷰하게 될 중간 기말 과제들이 몰려 오는 것들과 개인적인 내년 준비들에 대해 생각이 많아지게 되었다.

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (12/16) - 2025.11.22.

들어가며 추워진 날씨와 갑자기 다가온 연말 분위기 물씬 나는 여의도의 주말이고, 회사에서도 수업에서도 연말과 내년을 준비하느라 다들 분주한 상황이라 하겠다. 수업 시간 재료로 쓰려 했던 나눌 수 있는 기말 과제 발표들을 충분히 모으지 못한 상황에서 이야기하고 싶었던 몇몇 주제들을 모아 수업을 준비했다. 준비한 내용들12주) 강의 update추천시스템 - 5장 - 추천 알고리즘 상세 ( part 4 )지난 주에 Gemini를 전면에 내세운 구글의 본격적인 반격이 시작되었고, OpenAI 는 이에 기다렸다는 듯 코덱스 맥스로 반격하고 있다. 어떤 고귀한 뜻이 있을까 모르겠지만, anti-gravity를 보면서는 한편으로는 여전한 구글의 작명 센스에는 안타까움이 많다.먼저 similarweb 에서 발표한 GenAI + web 의 상황들에 대한 리포트를 같이 훑어 보았다. 유료는 아니지만 회원들에게 제공하는 리포트였고, 주로 AI 서비스와 검색 시장에 대한 작년 대비 변화에 대한 내용들이었다. SEO 이후 GEO 혹은 AEO 라는 이름으로 다양한 주장들과 논의들이 벌어지고 있고, 꽤 여러 전문가라 칭하고 있는 사람들이 말들을 얹고 있는 상황이지만, 좋은 스코어보드로서 similarweb 같은 데이터들이 중심을 잡아 주면 좋겠다는 생각이다. 아래는 간단 요약.‘Chatgpt’ 가 구글에서 ‘facebook’을 제치고 제일 많이 불리는 쿼리가 되었고deepseek strike 이후 구글의 AI mode 는 구글 검색 페이지에서의 배치 덕에 안착했다.전체 검색의 수는 줄어들고 있고, 구글 이외의 엔진들은 훨씬 더 많이 줄어들었다.여전히 구글 검색은 세션의 길이가 짧고, chatgpt 는 길게 물어본다. 세션 길이는 짧은 게 좋은 걸까? 긴 게 좋은 걸까 ?다음 파트에서는 스마트팩토리라는 토픽으로 지난 봄에 써 놓았던 글들을 같이 보면서 인이지(http://ineeji.com/) 와 관련된 이야기들을 나누었다. 피지컬 AI, 제조 공정 등의 키워드가 각광받고 있는데, 실제 현장에서 어떤 문제들을 어떻게 풀고 있는지에 대한 이야기들을 주로 정리했고, 수년 전 DX 이후 AX 라는 이니셔티브가 있지만, 실제 현장에서는 아직 오래된 공정, 잃을 게 많은 서비스 등의 이유로 많은 산업에서 일어나기 혁신이 일어나기 힘든 점들에 대해서 다양한 도메인들과 상황에 따른 이야기들을 나누었다. 새로운 장비들만 놓고 문제는 풀지 못하는 사례들도 있고, 여러 의미로 onpremise 를 고수해야 하는 상황 들도 꽤 강한 제약들로 여전히 작용하고 있는데, 최근에 팔런티어라는 새로운 공룡이 들어오면서 일어나는 변화들과 그 사이에서 역할을 찾으려는 크고 작은 기업들의 노력들이 앞으로의 관전 포인트라 하겠다. 클라우드 기반 스마트팩토리 - 용어들클라우드 기반 스마트팩토리 - 이슈들클라우드 기반 스마트팩토리 - 사례들 세번째 파트에서는 요즘 어딜 가나 듣게 되는 Agent / Agentic 이야기들을 거슬러 올라가서 LLM 이 처음 나왔을 때부터 어떻게 쓰면 좋을까 고민하던 업권의 노력들에 대해 정리를 하였다. prompt 잘 쓰기부터 fine tuning, RAG 를 이용하면서부터 생긴 정보 찾아 주기와 chain 로직을 이용한 다양한 답변 만드는 방법들에 이르기까지.. 한창 진행중인 논의들을 최근 정보들 위주로 다루었다. 여전히 변화무쌍한 상황들을 연결하는 역할을 하고 있는 MCP 까지.. 오늘은 키워드 중심으로 진행한 것이었지만 너무 간단하게 훑어서 이후에 어떤 것들을 조금 깊이 다뤄 볼까 고민이 된다.마지막으로 추천 시스템 파트에서는 교재에서는 남아 있던 부분인 행렬 분해와 자연어 처리를 이용하는 방법들에 대한 예제들을 나누었다. 고전적이지만, 사용자와 아이템의 거대한 행렬을 만들고 빈 칸을 예측하며 채워 나가는 꽤나 수학적 접근이고 사용자가 ‘좋아할 만한’ 아이템들을 예측하는 것으로 문제를 정의해 나가고 있다. 메타 정보들을 사용하기도 하고, 사용자들의 리뷰들을 풀어서 입력으로 사용하기도 하는 방법들이고, LDA 와 word2vec 을 적용하는 방법들에 대한 소개들이 있었다. 사용자의 purchase list 를 attribute 로 사용해서 user-user relation을 구현하는 방법들까지 정리가 되어 있다.교재로서 준비한 책에서 코드와 함께 다루는 내용들은 여기까지여서 더 깊은 이야기들을 마저 나누지 못하였고, 코드들은 링크들로 대체하며 조금 훑어 보긴 했다지만 아쉬운 마무리를 하게 되었는데, 조금은 고전적인 방법론들을 영감으로 각자 실무에 쓰임이 있는 내용들을 해 나갈 수 있길 약간은 무책임하지만 바래 본다. 맺으며중간 과제와 기말 과제들은 피드백을 부지런히 주고 받고 있지만, 아직 서로 읽어 보며 발표할 수 있을 정도의 글들이 많이 모이지는 않고 있다. 중간 과제인 EDA 리포트들은 다양한 주제들에 대해 기록들이 모이고 있어서 2주 후에 같이 정리할 수 있을 거 같고, 많은 기말 과제들은 마지막 시간에 몰리게 되는 것을 피할 수 없을 거 같다. 다음 주는 개인적인 사정으로 온라인 수업을 진행해야 하겠고, 진행했던 특강 중 하나를 담아 놓을 예정이다. 

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (11/16) - 2025.11.15.

들어가며가까이, 멀리 단풍이 꽤 잘 보이는 몇번 없는 맑은 가을 날씨이고, 길거리에 두꺼운 외투들이 보이는 것으로 보아 금방 겨울이 될 것이리라 싶다. 캘리포니아에는 이제 우기가 시작되며 짧은 낮이 시작되었겠다.강의실 옆 공간에서 2026년 신입 DFMBA 선발 과정의 면접이 있어 많은 경영대학과 DFMBA 교수님들께서 오셨고, 지난 2월의 올해 기수 오리엔테이션 이후 반년만에 인사드릴 수 있었다. 겸임 교수의 제한적인 경험들로 부족함이 많지만, 다른 교수님들께서 챙기지 못하는 부분을 담당해 준다고 하여 고마워 해 주셔서 오히려 어찌할 바를 모르기도 하고, 한편으로는 여전히 강의 평가 평균을 깎아 먹는 것들에 대해서 죄송하고 불안한 마음이다. 많은 일들이 그렇지만, 열심히 하는 거랑 결과가 나오는 게 매번 일치하지는 않는 거 같긴 하고, 진인사대천명의 가르침만 다짐해 본다. 준비한 내용들11주) 강의 updateLessons from Google Search - part 2.pptx며칠 전의 수능 시험 이후 각종 AI 서비스들이 이 문제들을 풀고 있으면서 스스로를 단련하기도, 혹은 출제자 진형에 이의를 제기하기도 하고 있다. 재작년에는 이 AI 들이 얼마나 잘 맞추고 있는가가 관건이었다면 지금은 얼마나 덜 틀리는가를 비교하며 자랑한다. 여전히 인서울 대학은 못 간다는 둥, 킬러 문항 혹은 영어 문장의 한글 이해 등에 차이가 있어 보이는데, 한글을 조금 다르게 이해하고 있는 것은 여러 면에서 은근히 걱정 거리이기도 하다.인공지능 파트에서는stateof.ai에서 industry 부분을 같이 이야기 나누었다. 100페이지 정도에 해당하는 지난 한 해동안 벌어진 일들이 총망라되어 있는 내용들이었고, 갑자기 전력, 부동산 등에 대한 이야기들이 과하게 논의되는 느낌이었다. Agent 라는 이름으로 스피디한 변화들이 많이 벌어지고 있고, ROI 를 중심으로 하는 비지니스에서 adoption 이 과할 정도로 일어나고 있으며, 그에 따른 거품들도 꽤 걱정스럽긴 하다. ㄲ개인적으로는 similarweb을 인용한 검색의 총량이 줄어드는 변화들이 관심이 많고, 하루 아침에 일들이 벌어지는 것보다 여기저기서 끊임없이 변화들이 있으리라. 여전히 미국에서는 chatgpt 를 써 보지 않은 사람들도 많고, 이들을 재교육시키는 것부터 많은 사업들의 기회와 변화가 있고, 마지막으로 빅테크의 플레이어들이 회사들을 너무 과하게 옮겨다니는데 개인적으로 상도덕과 이해가 가지 않아 혼란스럽긴 하다. 이건 자격지심과 부러움 혹은 꼰데 마인드라 해 두자 싶기도 하다.추천 시스템 파트의 남은 부분, 조금 고급 난이도의 구현 등은 다음 주로 놓고, 이번 주에는 구글 검색에 대한 특강 부분을 마무리 지었다. web result UI , rich snippets ( 지금은 rich results ) , knowledge panel , 구글이 이미 10년 전에 했던 crazy project 들을 다루고 그 뒤에 내가 직접적으로 관여했던 universal search, app search, app indexing 등의 챌린지들을 나누었다. AI 시대에 얼마나 가치가 있을 것인가 라는 질문들이 있는 것도 사실인데, 예전부터 agent 를 만든다면 제일 먼저 나 대신 검색을 하게 했을 거라는 생각에는 변함이 없고, 공개 자료면 표준에 맞게 잘 해 놓아서 이들이 이전에 노력한 대로 따라가야 하지 않겠느냐 라는 시각에서 이야기들을 나누었다.학생들의 질문들이 있을 경우, 조금 더 심각하게 많은 이야기를 나눌 수 있는 내용들이기도 해서, 나름 많은 내용들을 나눌 수 있는 주제이긴 한데, 한편으로 audience 입장에서 진입 장벽 또한 높게 있다 싶다. 당시 구글이라는 소프트웨어와 데이터에 진심인 서비스라는 만들어 져 있는 토대 위에 내 노력들이 살짝 더해진 것이었을 것이고, 마냥 좋은 경험이었다 라고 두리뭉실하게 접어 놓기에는 이래저래 아쉬운 마음이 든다. 맺으며본격적인 숙제 검사의 시간들이 진행되고 있고, 시간이 허락할 때마다 신청하는 학생들의 진로 상담 등도 힘 닿는대로 거들고 있다. 과정의 특성 상 대부분 생짜 취준생이기 보다는 예비 이직러들에 가깝긴 하고, 길게 여러 일을 하고 싶어하는 학생들에게 20년 혹은 그 뒤를 바라보며 이야기를 나눈다는 게 얼마나 현실적일까 싶기도 하지만, 각자 걸러 들을 만큼 걸러 듣고 도움이 되는 이야기들만 담아 갈 수 있기를 바라며, 이 인연들이 조금이라도 내 덕을 볼 수 있기를 기도한다. 

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (9/16) - 2025.11.1.

들어가며개인 일정으로 미국에서 진행해야 하는 주여서 온라인으로 진행했다. 지난 번의 온라인 수업은 추석 연휴 중에 있었지만, 이번은 그게 아니어서 줌을 통한 라이브로 갈 지, 녹화 영상을 준비해서 주 단위로 준비할 지 논의가 있었는데, 토요일 오후에서 각자의 자리에서 줌 접속을 기대하는 게 여의치 않아서 녹화 영상으로 대체했다.학기 초부터 준비했던 ‘해 봐서 아는’ 일들 중 하나로 플레이스토어 이야기들을 정리했고, 녹화된 영상의 방법으로 잘 전달이 되었으면 하는 바램이다. 기존에 동작하고 있는 서비스를 설명하고 예를 들어 하나의 기능을 처음부터 기안해서 운영하기까지를 다룬 내용으로, 특히 제품 기획 혹은 담당하는 입장에서 하나의 타산지석이 되면 좋겠다는 생각이다. 준비한 내용들9주) 강의 updateGoogle(Playstore)에서 과제 런칭하기 - 2.pptx 나눈 이야기들APEC 회의 전후로 다수의 굵직한 협약들이 기업간, 정부간에 발표되었고, GPU 26만장 이슈가 한창이다. 개인적으로는 Physical AI, LLM, agent 등의 다양한 키워드들이 비슷한 선상에서 통용되고 있는 상황, 소버린 AI 를 이야기할 때 필요한 좋은 한글 컨텐츠 등의 운영에 더 많은 우려와 의견들이 있지만, 그 우려들도 저 GPU들 없이는 무용지물이니 일단 응원의 마음이 먼저라는 점은 명확하고, 관객, 코치가 아닌 내가 선수로 다시 뛴다면 어디서 무엇을 어떻게... 라는 고민을 다시 해 본다.업권에 관심 있는 뉴스로는 OpenAI 와 PayaPal 의 wallet 을 이용한 instant checkout 이 눈에 들어왔다. 얼마전 거의 비슷한 시기에 Google 주도로 Agent Payments Protocol 을 PayPal 을 비롯한 꽤 많은 회사들과 만들어 발표하고, 그리고 그 리스트에 없던 Stripe 만 OpenAI 와 Agentic Commerce Protocol 을 만들어서 다들 어떻게든 payment의 벽을 헤쳐 나가겠다는 의지를 보였는데, 이 뉴스는 PayPal 의 wallet expansion strategy 와 맞아 떨어지려는 것으로 읽혀 또하나의 대세 혹은 전쟁이 일어나는 공간이겠구나 싶은 생각을 했다.  서비스 이야기 중 플레이스토어 관련 내용에서는 제품의 설명에 대해 마무리한 후에, 실제 '해 봐서 잘 아는', 기안하고 진행했던 세 과제에 대해서 이야기를 나누었다. Fulfillment 부분이 빠진 유사 쇼핑몰의 성격이지만, 그래도 있을 건 다 있는 꽤 오래된 서비스이기에 참고하기에 나쁘지 않다 싶고, 여기에 구글에서 life of a project 가 살짝 덤으로 포함되어 있다.당시 한국과 일본 제품을 담당하던 시기에 제품 책임자의 위치에서 역할을 하고 있었을 때였고, 풀고 싶었던 혹은 풀어야 했던 문제들을 발견, 정의, 구현, 부작용 발견, 재구현, 회고 후 운영까지의 경험들을 담백하고 이야기 하고 싶었다. 아래 과제 이름 등이 한글로 미처 번역해 준비해 놓지 못한 부분은 살짝 아쉽다.Locale-aware scoringPre-registrationLocale-ready signals 맺으며모이는 중간과제들을 내외부로 어디까지 공개할 것인지 기술적인 조절을 하고 있고, 기말과제는 아직 완제품이 모이지 않고 있다. 수업 시간에 이야기거리를 더 준비해야 만들어야 하는 부담이 살짝 생기게 되었고 기말에 몰리게 될 게 예상되어 개인적인 일정들을 그에 맞게 조절해야 하겠다, 특히 이번 시간에는 추천시스템 부분에서 조금 복잡한 선형 회귀 방법들을 같이 이야기해야 하는데, 한글, 영어가 섞여 난이도가 꽤 있다.일정이 예상대로 진행되면 목요일 밤에 출발해서 토요일 새벽에 공항에 도착하는데, daylight saving 이 풀리면서 한 시간 여유가 사라져 바로 여의도로 짐과 함께 이동해야 하는 일정이어야 할 거 같다. 정신 차려 보니 겨울이 다시 와 있겠다 싶다.

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (8/16) - 2025.10.25

들어가며개인적인 용무들을 본 후 12시 넘어 조금 빠듯하게 도착을 하였다. 주중에 분량 조절을 꽤 하는 편이었는데, 이번 주는 코드 구현이 들어가 있어 가늠이 잘 되지 않았다. 준비한 내용들을 다 훑었는데, 2시간 정도가 지나게 되었다. 바이브 코딩의 세상에 이렇게 하는 게 어떤 의미가 될까 한 번 고민해 보기도 한다.학생들의 과제들로 수업이 채워지면 좋겠다 싶은데, 아직 중간 과제와 기말 과제 현황판에 제안들이 예년 대비 많이 부족해 보인다. 수업 태도라고까지는 모르겠지만, 절반 정도의 학생들에게는 아직 무엇을 해야 하는지가 전달이 되지 않은 거 같아 조금 걱정스럽다.단풍이 보이는 가을의 여의도. 준비한 내용들8주) 강의 update추천시스템 - 5장 - 추천 알고리즘 상세 ( part 2 ) 나눈 이야기들인공지능 부분에서는 stateofai 2025 의 총평들과 survey 내용들에 대해 이야기를 나누었다. 작년의 10개 예측에 대한 평가들은 절반 정도가 적중했고, 내년에도 10개의 내용을 예측하였는데, reasoning 을 하나의 축으로 놓고, 각종 agentic 서비스들이 난무하게 될 것이라 여전히 복잡한 일들이 있게 되겠다.stateof.ai 2024년 예측의 성적표stateof.ai 2025년 예측들선수들이 인정하는 AI lab 순서들추천 시스템 영역에서는 MovieLens 에서 실제 추천 서비스를 만들어서 앞시간에 했던 지표들을 비교하는 과정을 담았다. 그 중 직관적인 설명이 가능한 무작위, 통계 정보, 연관 규칙 세 가지에 대해서 어떻게 구현하였는지에 대한 해설들과 함께 코드들을 같이 보았다.수업 시간에 커버한 추천 시스템 구현 방법들한글과 영어가 섞여 있어 애매하지만, 그래도 내용들이 직관적이어서 아이디어들을 설명할 수 있는 정도는 되었다. 하지만, colab 으로 execution button 을 누르는 것들만으로는 이래저래 한계가 있고, 학생들이 이것저것 바꾸어 체크해 보면 좋을텐데 하는 생각으로 진행하였다. 다음 시간부터는 더 복잡한 user-user 협조 필터링과 행렬 분해를 위한 여러 노력들을 설명하게 될텐데, 이대로 괜찮을까 하는 걱정이 조금 든다.Random 에 대한 이야기를 꽤 오래 나누었다. Random 자체가 합의된 정의가 없는 것이고, 돌릴 때마다 다르게 나오는 것, 미래에 대해서는 50% 확률, 게임 가차에서 반대로 지켜야 하는 입장에서의 활용, 정규 분포 등에 대한 이야기들을 하였고, 예전 구글 면접 때 풀었던 monkey sort ( bogo sort ) 에 대한 이야기들과 복잡도들 설명을 나누었다. 맺으며다음 주는 개인적인 사정이 있어 미국에서 리모트로 진행을 해야 한다. 녹화를 해서 방송하려 하니 시차 등의 난이도가 더 높은 거 같은데, 플레이스토어 못다한 부분을 마무리지으려 한다.대부분 사회 생활들을 꽤 한 MBA 과정의 학생들이지만, 해외로 취직을 계획하며 준비하는 학생이 있어 수업 후 여의도에서 커피챗을 한 시간 남짓 하였다. 개발자가 아닌 친구들이 글로벌 꿈을 펼치는 방법이 어떤 것들이 있을까 궁금하기도 하고, 선수와 코치, 감독 사이에서 여전히 고민하는 개인적인 시각까지 더해서 여러 가지 면에서 고민들이 많아지지만, 또다른 에너지를 반대로 얻을 수 있는 시간이었다.

대학 교육 기타인공지능추천시스템

인공지능과 추천 시스템 강의 노트 (7/16) - 2025. 10. 17

들어가며 연휴 이후 첫 수업인데, 토요일에 강의장에서 일정이 있어 금요일 저녁으로 이동해서 수업을 진행하였다. 꽤 오랫동안 잊고 있었는데, 금요일 오후의 여의도는 토요일 오전보다 훨씬 북적이는 동네였다.이전의 두 번의 녹화 온라인 강의가 강제로 끝까지 보게 하는 내용이라 하여 장단점이 있다 싶었고, 학기 말까지 남은 다음 2번의 원격 수업을 아예 녹화로 진행해야 할까 하는 생각을 해 보게 되었다. 준비한 내용들 7주) 강의 update추천시스템 - 5장 - 1 나눈 이야기들한시간 분량의 수업을 준비하는 내용은 양에서는 적었지만, 추천 시스템 항목에서 MovieLens 데이터의 EDA 를 조금 진지하게 하게 되었는데, 학교에 있는 Chrome + colab 등으로 입코딩과 클릭 클릭을 해야 하는 수업이었다. 학교 PC 에 뭘 설치하기도 애매하기에 여러 방법을 고려해 봤지만, 이 정도가 맞는 거 같은데, 해 본 사람들에게는 아무 것도 아닌 일일 수도, 여전히 처음 해 본 사람들한테는 진입 장벽일 수 있겠다.학생들 각자 보고 싶은 데이터는 직접 보며 분석했으면 하는 마음에 pre-requisite 으로 Python 을 놓았고, 자유 방식의 EDA를 과제로 내었는데, 한 학생은 이 벽을 넘지 못하고 혹은 넘지 않고 과제를 drop 하였다. 코딩 자체를 평가 잣대로 놓지는 않기에 용기를 내기에 나쁘지 않은 환경이라 생각하는데 이래저래 아쉬움이 있다. 이후 근처의 식당에서 간담회를 진행했는데, 조금 자유로운 분위기에서 여러 이야기들을 나누며 명함들을 수집하였다. 절반 정도의 학생들이 참석을 하였고, 미래야 모른다지만, 이것도 인연인데 싶다. p.s.학생 하나가 7개월 아기와 함께 수업에 들어오게 되었다. 뉴스로만 접하던 상황이어서 조금 신선하긴 했고, 아기네 식구들과 다른 학생들 모두에게 불편하지 않은 상황이었기를 바라는 마음으로 이야기들을 진행했다. 다행히 울지 않은 순한 아이였고, 한국에서 거의 처음으로 유모차에 사람이 앉아 있는 것을 본 기억이기도 하다.

대학 교육 기타인공지능추천시스템

채널톡 아이콘