안녕하세요. 저는 파이썬을 활용한 데이터 분석 및 인공지능 서비스 개발 실무를 하고 있습니다. 관심 있는 주제를 찾아서 공부하고 그 내용들을 많은 분들과 공유하기 위해 꾸준하게 책을 집필하고 인공지능 강의를 진행해 오고 있습니다.
[이력]
현) 핀테크 스타트업 CEO
전) 데이콘 CDO
전) 인덕대학교 컴퓨터소프트웨어학과 겸임교수
Kaggle Competitin Expert, 빅데이터 분석기사
[강의]
NCS 등록강사 (인공지능)
SBA 서울경제진흥원 새싹(SeSAC) 캠퍼스 SW 교육 ‘우수 파트너 선정’ (Python을 활용한 AI 모델 개발)
금융보안원, 한국전자정보통신산업진흥회, 한국디스플레이산업협회, 대구디지털산업진흥원 등 강의
서울대, 부산대, 경희대, 한국외대 등 국내 주요 대학 및 국내 기업체 교육 경험
[집필]
파이썬 머신러닝 판다스 데이터 분석(정보문화사) : https://zrr.kr/x1ec
파이썬 딥러닝 머신러닝 입문(정보문화사) : https://zrr.kr/RPaE
파이썬 딥러닝 텐서플로(정보문화사) : https://zrr.kr/PrVN
실무자를 위한 파이썬 Python 100제(정보문화사) : https://zrr.kr/4fyq
랭체인(LangChain) 입문부터 응용까지 (위키독스) : https://wikidocs.net/book/14473
[유튜브] 판다스 스튜디오 : https://youtube.com/@pandas-data-studio?si=XoLVQzJ9mmdFJQHU
Courses
Reviews
- graphRAG - Knowledge Graph-based RAG System Implementation with Neo4J (feat. LangChain)
- RAG System Implemented with AI Agents (w. LangGraph)
- LangChain Basics for Beginners
- RAG System Implemented with AI Agents (w. LangGraph)
- Learn Python Chatbot & RAG through Projects - Using LangChain, Gradio
Posts
Q&A
neo4j 데스크탑 config파일설정변경
안녕하세요. 판단스 스튜디오입니다. Neo4J Desktop 2.0 버전이 새롭게 출시되면서 UI에 변화가 많이 있었습니다. 강의는 버전 1.6 기준입니다. 아래 다운로드 링크에서 1.6.3 버전을 선택해서 설치하시면 같은 환경에서 실습 가능하실거에요. https://neo4j.com/deployment-center/?desktop-gdb(사진)
- 0
- 2
- 15
Q&A
휴..
안녕하세요. 판다스 스튜디오입니다. 섹션6. 29강 CrewAI Tools 도구 사용 - PDFSearchTool 추가 (실습) 강의에서 "자료 다운로드" 클릭하시면 실습코드와 pdf 파일이 들어 있는 zip 파일을 다운로드 받을 수 있습니다. 압축을 해제했는데도 파일이 안보이시면, 반디집 or 알집 등 전용 압축프로그램을 사용해보시기 바랍니다. 자료 확인이 계속 안되시면, pandasdataanalysis@gmail.com 메일로 연락주세요. 직접 보내드리겠습니다. 감사합니다.
- 0
- 2
- 20
Q&A
rag 와 랭체인
안녕하세요. 판다스 스튜디오입니다. RAG가 더 주목받는 이유는 다음과 같이 4가지 정도로 정리할 수 있을 것 같습니다. 정보의 실시간성: 파인튜닝은 한 번 학습하면 모델 내부에 지식이 고정됩니다. 회사 정책이 바뀌거나 제품 정보가 업데이트되면 모델을 다시 학습시켜야 합니다. 반면 RAG는 문서만 업데이트하면 즉시 최신 정보를 반영할 수 있습니다.비용 효율성: 파인튜닝은 수천 개의 학습 데이터를 준비하고, GPU로 학습하며, 정보가 바뀔 때마다 재학습해야 합니다. RAG는 벡터 데이터베이스 유지 비용만 들며, 문서 업데이트로 끝납니다.답변의 투명성: RAG는 "이 답변이 어느 문서의 몇 페이지에서 왔다"는 출처를 명확히 제시할 수 있습니다. 파인튜닝된 모델은 어디서 그 정보를 배웠는지 알 수 없어 신뢰성 검증이 어렵습니다.대용량 지식 처리: LLM은 한 번에 처리할 수 있는 컨텍스트가 제한적입니다. 수만 페이지의 법률 문서나 회사 전체의 Google Drive, Slack 메시지를 모두 파인튜닝에 넣는 것은 불가능하거나 비효율적입니다. RAG는 필요한 부분만 검색해서 제공하기 때문에 대용량 문서에 적합합니다.감사합니다.
- 0
- 2
- 23
Q&A
score 기반 서치
안녕하세요. 판다스 스튜디오입니다.RAG 시스템에서 Score Threshold(유사도 임계값)을 설정할 때는 보수적인 접근이 적정하다고 생각합니다. 초기에는 0.75~0.8 정도의 높은 임계값으로 시작하여 관련성이 높은 문서만 검색되도록 하는 것이 안전합니다.한편, 낮은 임계값으로 시작하면 관련 없는 문서가 검색 결과에 포함되어 LLM이 잘못된 정보를 기반으로 답변을 생성할 위험이 있습니다. 특히 잘못된 정보가 노이즈로 작용해서 환각(hallucination) 문제를 발생시키는 요인으로 작용할 수 있습니다.실무적으로, 높은 임계값에서 시작하면 결과가 적더라도 품질이 보장되므로 시스템의 신뢰성을 확보할 수 있습니다. 이후 실제 사용 데이터와 사용자 피드백을 수집하면서 점진적으로 임계값을 낮춰가는 방식이 가장 안전합니다.감사합니다.
- 0
- 2
- 21
Q&A
RAG 강의 prompt 질문
안녕하세요. 판다스 스튜디오입니다. PromptTemplate은 레거시 호환성을 위해 존재하며, 현재는 ChatPromptTemplate 사용을 권장하고 있습니다. 모든 최신 모델(GPT-4, Claude, Gemini 등)이 ChatModel 인터페이스를 지원하므로, ChatPromptTemplate을 사용하는 것이 좋습니다. 다만, ChatPromptTemplate 또한 PromptTemplate의 template 메소드를 지원하기 때문에, 혼동이 있을 수 있습니다. 다시 한번 말씀드리면, LLM이 발전하면서 ChatModel 인터페이스가 표준으로 자리잡고 있기 때문에, 가능한 ChatModel 인터페이스 기준으로 사용하는 것이 좋습니다.
- 0
- 2
- 23
Q&A
Preview KG_P1_02_neo4j_cypher_advanced.md자료
안녕하세요. 판다스 스튜디오입니다. 강의에서 활용한 md 파일의 내용을 확인하실 수 있도록 해당 강의 수업자료에 pdf 버전으로 업로드해두겠습니다. 다운로드에 문제가 있으면 말씀해주세요. 감사합니다.
- 0
- 1
- 22
Q&A
KR.txt파일이 없습니다.
안녕하세요. 반디집 등 압축 전용 프로그램으로 해보시기 바랍니다.계속 문제가 있으면 pandasdataanalysis@gmail.com주소로 이메일 보내주시면 따로 보내드리겠습니다.
- 0
- 2
- 38
Q&A
id(actor) 와 관련한 질문입니다
안녕하세요. 판다스 스튜디오입니다. id(actor)는 Neo4j가 자동으로 부여하는 내부 ID를 조회하는 함수입니다. 여기서 내부 ID는 Neo4j가 노드 생성 시 자동으로 부여하는 고유 번호입니다. 그런데, actor.id는 사용자가 노드 생성할 때 직접 저장한 "id"라는 이름의 속성값입니다. 즉, 노드의 속성 중 하나입니다. 결론적으로 Neo4j 시스템에서 부여하는 내부 ID와 사용자가 지정하는 명시적인 속성값인actor.id는 다른 개념입니다. 감사합니다.
- 0
- 2
- 23
Q&A
쿼리문 질문 드립니다.
안녕하세요. 판다스 스튜디오입니다. 좋은 질문 감사드립니다. 두 쿼리의 차이는 매칭 방식에 있습니다. WHERE ANY(title IN $movie_titles WHERE movie.title CONTAINS title) 쿼리는 부분 문자열을 포함하는지 확인합니다. 예를 들면, "Matrix"가 "The Matrix"에 포함되면 매칭됩니다.반면, WHERE movie.title IN $movie_titles 쿼리는 정확히 일치하는 조건을 나타냅니다. 따라서, "Matrix"와 "The Matrix"는 다른 문자열이므로 매칭되지 않습니다. 그리고, ANY(title IN $movie_titles WHERE movie.title CONTAINS title) 구문은 Cypher의 리스트 축약 문법입니다. $movie_titles 리스트의 각 title에 대해 movie.title CONTAINS title 조건을 확인하고 하나라도 참이면 전체가 참이 됩니다. (부분 문자열 매칭) GraphRAG에서는 LLM이 영화 제목을 정확히 추출하지 못할 수 있으므로, CONTAINS를 사용한 부분 매칭이 더 유연하고 실용적인 방법입니다. 감사합니다.
- 0
- 3
- 37
Q&A
프로젝트 4 법률 실습데이터 존재하지 않음
안녕하세요. 판다스 스튜디오입니다. 윈도우 사용하시면 반디집 같은 압축 프로그램으로 실행하면 파일이 정상적으로 확인이 되실 거에요. 법령 정보 사이트에서 pdf 변환하는 과정이나 pdf 로더 라이브러리 버전 업데이트 등으로 결과가 일부 다르게 나올 수 있습니다. 실습 파일은 다시 한번 확인해보겠습니다. 계속 문제가 발생하면 말씀해주세요. 감사합니다.
- 0
- 2
- 26







