안녕하세요. 저는 파이썬을 활용한 데이터 분석 및 인공지능 서비스 개발 실무를 하고 있습니다. 관심 있는 주제를 찾아서 공부하고 그 내용들을 많은 분들과 공유하기 위해 꾸준하게 책을 집필하고 인공지능 강의를 진행해 오고 있습니다.
[이력]
현) 핀테크 스타트업 CEO
전) 데이콘 CDO
전) 인덕대학교 컴퓨터소프트웨어학과 겸임교수
Kaggle Competitin Expert, 빅데이터 분석기사
[강의]
NCS 등록강사 (인공지능)
SBA 서울경제진흥원 새싹(SeSAC) 캠퍼스 SW 교육 ‘우수 파트너 선정’ (Python을 활용한 AI 모델 개발)
금융보안원, 한국전자정보통신산업진흥회, 한국디스플레이산업협회, 대구디지털산업진흥원 등 강의
서울대, 부산대, 경희대, 한국외대 등 국내 주요 대학 및 국내 기업체 교육 경험
[집필]
파이썬 머신러닝 판다스 데이터 분석(정보문화사) : https://zrr.kr/x1ec
파이썬 딥러닝 머신러닝 입문(정보문화사) : https://zrr.kr/RPaE
파이썬 딥러닝 텐서플로(정보문화사) : https://zrr.kr/PrVN
실무자를 위한 파이썬 Python 100제(정보문화사) : https://zrr.kr/4fyq
랭체인(LangChain) 입문부터 응용까지 (위키독스) : https://wikidocs.net/book/14473
[유튜브] 판다스 스튜디오 : https://youtube.com/@pandas-data-studio?si=XoLVQzJ9mmdFJQHU
강의
로드맵
전체 1수강평
- 프로젝트로 배우는 Python 챗봇 & RAG - LangChain, Gradio 활용
- AI 에이전트로 구현하는 RAG 시스템(w. LangGraph)
- 입문자를 위한 LangChain 기초
게시글
질문&답변
KR.txt파일이 없습니다.
안녕하세요. 반디집 등 압축 전용 프로그램으로 해보시기 바랍니다.계속 문제가 있으면 pandasdataanalysis@gmail.com주소로 이메일 보내주시면 따로 보내드리겠습니다.
- 0
- 2
- 23
질문&답변
id(actor) 와 관련한 질문입니다
안녕하세요. 판다스 스튜디오입니다. id(actor)는 Neo4j가 자동으로 부여하는 내부 ID를 조회하는 함수입니다. 여기서 내부 ID는 Neo4j가 노드 생성 시 자동으로 부여하는 고유 번호입니다. 그런데, actor.id는 사용자가 노드 생성할 때 직접 저장한 "id"라는 이름의 속성값입니다. 즉, 노드의 속성 중 하나입니다. 결론적으로 Neo4j 시스템에서 부여하는 내부 ID와 사용자가 지정하는 명시적인 속성값인actor.id는 다른 개념입니다. 감사합니다.
- 0
- 2
- 17
질문&답변
쿼리문 질문 드립니다.
안녕하세요. 판다스 스튜디오입니다. 좋은 질문 감사드립니다. 두 쿼리의 차이는 매칭 방식에 있습니다. WHERE ANY(title IN $movie_titles WHERE movie.title CONTAINS title) 쿼리는 부분 문자열을 포함하는지 확인합니다. 예를 들면, "Matrix"가 "The Matrix"에 포함되면 매칭됩니다.반면, WHERE movie.title IN $movie_titles 쿼리는 정확히 일치하는 조건을 나타냅니다. 따라서, "Matrix"와 "The Matrix"는 다른 문자열이므로 매칭되지 않습니다. 그리고, ANY(title IN $movie_titles WHERE movie.title CONTAINS title) 구문은 Cypher의 리스트 축약 문법입니다. $movie_titles 리스트의 각 title에 대해 movie.title CONTAINS title 조건을 확인하고 하나라도 참이면 전체가 참이 됩니다. (부분 문자열 매칭) GraphRAG에서는 LLM이 영화 제목을 정확히 추출하지 못할 수 있으므로, CONTAINS를 사용한 부분 매칭이 더 유연하고 실용적인 방법입니다. 감사합니다.
- 0
- 3
- 26
질문&답변
프로젝트 4 법률 실습데이터 존재하지 않음
안녕하세요. 판다스 스튜디오입니다. 윈도우 사용하시면 반디집 같은 압축 프로그램으로 실행하면 파일이 정상적으로 확인이 되실 거에요. 법령 정보 사이트에서 pdf 변환하는 과정이나 pdf 로더 라이브러리 버전 업데이트 등으로 결과가 일부 다르게 나올 수 있습니다. 실습 파일은 다시 한번 확인해보겠습니다. 계속 문제가 발생하면 말씀해주세요. 감사합니다.
- 0
- 2
- 21
질문&답변
LangChain 질문
안녕하세요. 판다스 스튜디오입니다. 좋은 의견 감사드립니다. 질문 주신 내용에 대해서 우선 답변 드립니다. 말씀해주신 것처럼 LangSmith는 LangChain 애플리케이션의 개발, 모니터링, 디버깅을 위한 플랫폼으로 세부적인 사용방법을 강의에서 다루지 않았습니다. 강의 소개 페이지에서 선수 지식으로 안내해드린 "[무료 강의] 입문자를 위한 LangChain 기초(필수)" 등을 통해서 LangChain과 LLM의 기본 개념을 학습하실 수 있습니다. 그리고, 한글 정보 이해 부분은 LLM의 한글 이해 능력을 말씀하신 것인지 아니면, Neo4j 데이터베이스에서의 한글 처리 부분을 말씀하신 것인지 댓글 남겨주세요. 감사합니다.
- 0
- 2
- 28
질문&답변
system 메세지는 정의가 되어 있는 건가요?
안녕하세요. 판다스 스튜디오입니다. 시스템 메시지의 역할과 사용자 메시지의 역할을 구분하시면 이해하시는데 도움이 됩니다. 시스템 메시지는 '시스템 운영자(개발자)' 입장에서 AI에게 전달하는 내용을 처리하고, 사용자 메시지는 '실제 시스템을 이용하는 유저(End User)'가 AI에게 전달하는 메시지라고 볼 수 있습니다. 일반적으로 시스템 메시지가 우선 적용되기 때문에, 여행 전문가라고 지정하게 되면 이 시스템의 답변을 출력할 때 여행 전문가의 관점에서 생성하게 됩니다. 말씀해주신 것처럼 사용자가 여행과 다른 질문을 했을 때, 어떻게 동작해야 하는지도 시스템 메시지에 추가 설정하는 것도 가능합니다. 감사합니다.
- 0
- 2
- 14
질문&답변
krag를 이용한 검색기법 평가관련 질문
네, 맞습니다. 말씀해주신 것처럼 평가 데이터셋이 필요합니다. 일반적으로 해당 분야 전문가가 직접 만들어서 사용합니다. 강의에서는 데이터셋을 LLM으로 합성하고, 이를 전문가가 보완하는 시나리오로 설명드리고 있습니다.
- 0
- 2
- 29
질문&답변
MMR 관련 질문입니다.
안녕하세요. 판다스 스튜디오입니다.MMR 검색에서 fetch_k를 전체 문서로 한다면, 쿼리와의 유사도를 고려하지 않고 랜덤으로 선택하는 것과 비슷한 결과가 됩니다. 쿼리와의 유사도 기준으로 fetch_k만큼 검색해서 비슷한 문서를 가져온 뒤에, 그 중에서 다양성을 확보하는 것을 의도하는 방법입니다.
- 0
- 1
- 30
질문&답변
Text_splitter관련 질문입니다.
안녕하세요. 판다스 스튜디오입니다. LangChain의 CharacterTextSplitter는 일반적으로 separator가 우선적인 제약 조건이고, chunk_size가 보조 기준으로 작동합니다. 정규식 기준이 충족되면 분할점이 생기고, chunk_size보다 작은 경우에는 결합하고 chunk_size보다 큰 청크는 그대로 남게 됩니다.
- 0
- 2
- 31
질문&답변
오픈api key는 따로 구매해야되는 걸까요?
안녕하세요. 판다스 스튜디오입니다. OpenAI API는 유료 서비스입니다. 별도로 구매하셔야 합니다. 무료로 사용할 수 있는 대안으로는 Google Gemini API, Groq API, Ollama 등이 있습니다. 확인해보시고 추가 문의가 있으시면 편하게 말씀해주세요. 감사합니다.
- 0
- 2
- 44







