
빅데이터/텍스트마이닝 분석법 (LDA,BERTtopic,감성분석,CONCOR with ChatGPT)
HappyAI
파이썬과 ChatGPT를 활용한 텍스트마이닝 분석 기법,빅데이터 분석 기법, 단어빈도분석,워드클라우드 시각화, 형태소분석,토픽모델링 분석 기법을 배우며, 논문 작성 시 필요한 텍스트마이닝 데이터 분석 기법 활용법, 연구논문에 기초적인 활용법에 관한 강의입니다.
초급
빅데이터, 텍스트마이닝
ChatGPT는 쓰는데, 왜 이런 답이 나오는지는 설명하기 어렵지 않으셨나요? “RAG, 에이전트, 파인튜닝… 용어는 아는데 정확히 설명하긴 어렵다” “LLM관련 용어를 들으면 말문이 막힌다” “AI 회의에서 개념 설명이 항상 애매하다” 이 강의는 바로 이런 분들을 위해 만들어졌습니다. 이 강의는 LLM을 ‘툴’이 아니라 ‘구조’로 이해하기 위한 이론 강의입니다. ChatGPT나 Gemini를 사용하는 법이 아니라, 왜 그렇게 동작하는지 설명할 수 있는 기준을 만들어 줍니다.
수강생 179명
난이도 입문
수강기한 무제한







한화시스템/ICT
임직원들도 이 강의를 듣고 있어요!





한화시스템/ICT
임직원들도 이 강의를 듣고 있어요!
먼저 경험한 수강생들의 후기
5.0
Goldie
기초 다지기 좋습니다.
5.0
leckar1231
강의 자료 제공과 &A에 대한 답변만 이뤄지면 더 좋을 것 같습니다. 전체적인 개념을 잡기엔 정말 좋은 내용들입니다!
5.0
구윤모
이해하기가 쉽고, 명확한 설명이 공부하는데 도움이 많이 됩니다.
LLM이 답을 만드는 과정을 이해하는 구조적 사고
프롬프트·RAG·Agent 등 핵심 개념을 헷갈리지 않는 기준
AI 관련 논의를 정확히 따라갈 수 있는 이해력
LLM의 한계와 파라미터를 고려한 현실적인 판단 감각
ChatGPT나 Gemini를 쓰지만 작동 원리가 궁금하셨나요?
이 강의는 LLM의 기본 개념부터 차근차근 설명하고,
프롬프트·RAG·Agent의 핵심 기술을 어렵지 않게 이해할 수 있도록 돕습니다.
내 것으로 만드는 이론 강의
ChatGPT와 Gemini를 사용하고 있지만
왜 그런 답이 나오는지 궁금하지 않으셨나요?
이 강의는 LLM의 기본 구조부터 핵심 개념까지
복잡한 수식 없이, 이해 중심으로 설명합니다.
Transformer, Self-Attention은 물론
프롬프트·RAG·Agent가
LLM 내부에서 어떻게 작동하는지를 자연스럽게 연결해 이해할 수 있습니다.
툴 사용법이 아니라,
AI를 판단할 수 있는 기준을 만드는 강의입니다.
이 강의는 단순한 툴 사용법이나 트릭을 다루지 않습니다.
LLM이
어떻게 문맥을 이해하고
왜 환각(Hallucination)이 발생하며
그래서 프롬프트·RAG·파인튜닝·Agent가 등장했는지
를 수식 없이, 구조 중심으로 차근차근 핵심적인 내용에 대한 이론을 설명합니다.
Transformer, Self-Attention, 토큰, 임베딩 같은 핵심 개념을
논문 나열이 아닌 직관적인 흐름으로 연결해 이해할 수 있도록 구성했습니다.
ChatGPT는 사용하지만 LLM 개념이 늘 헷갈리는 분
RAG·Agent 이야기가 나오면 회의에서 이해가 안 되는 기획자·PM
AI 도입이나 활용 전략을 고민하는 현업 실무자
개발자는 아니지만 LLM을 제대로 이해하고 싶은 분
“LLM 이론 입문 강의”를 찾고 있는 학습자
❌ ChatGPT 기능 설명 강의
❌ 특정 AI 툴 사용법 위주의 강의
❌ 자동화·업무 효율 중심 실습 강의
이 강의는 LLM의 구조와 작동 원리를 이해하는 이론 중심 강의입니다.
AI를 그냥 쓰는 사람에서
AI를 이해하고 설계할 수 있는 사람으로
생성형 AI와 LLM의 기본 원리를 탐구합니다. LLM이 방대한 텍스트 데이터를 통해 언어의 의미와 맥락을 통계적으로 학습하여 자연스러운 문장을 생성하는 방식을 이해합니다.
LLM 기술의 최신 발전 트렌드를 살펴보고, 글로벌 AI 경쟁 구도 속에서 LLM의 미래 전략 방향을 분석합니다. 이는 LLM 기술의 현재와 미래를 조망하는 데 도움을 줄 것입니다.
LLM의 근본적인 작동 원리를 학습합니다. 토큰, 임베딩, 벡터 공간, 컨텍스트 윈도우 등 핵심 개념을 이해하고, 주요 출력 제어 파라미터에 대해 알아봅니다.
LLM의 성능을 극대화하기 위한 프롬프트 엔지니어링의 기본 개념과 고급 기법을 다룹니다. Zero-shot, Few-shot, Chain-of-Thought(CoT) 등 다양한 패턴을 익혀 효과적인 프롬프트 작성 능력을 함양합니다.
LLM의 환각(Hallucination) 및 최신 정보 부족과 같은 한계를 극복하기 위한 RAG(Retrieval-Augmented Generation) 아키텍처를 학습합니다. RAG의 핵심 요소인 임베딩과 벡터 데이터베이스를 이해하고 전체 작동 흐름을 파악합니다.
RAG 시스템의 정확도를 평가하는 지표와 방법론을 학습하고, 실제 적용 가능한 성능 개선 기법들을 탐구합니다. 이를 통해 RAG 시스템의 효율성과 신뢰성을 높이는 방안을 모색합니다.
특정 작업이나 도메인에 LLM을 적응시키는 파인튜닝의 기본 개념과 적용 전략을 배웁니다. 또한, PEFT(Parameter-Efficient Fine-Tuning)와 같은 경량 튜닝 기법을 통해 효율적인 모델 튜닝 방법을 습득합니다.
Agent의 개념과 구조를 이해하고, 다양한 LLM Agent 유형을 살펴봅니다. 실제 업무 및 서비스에 Agent를 어떻게 활용할 수 있는지 구체적인 사례를 통해 학습합니다.
최신 멀티 에이전트 시스템 이론인 MCP(Multi-agent Cooperative Planning)와 A2A(Agent-to-Agent)의 개념, 작동 원리, 그리고 구조 및 활용 방안을 비교 분석합니다. 이를 통해 진보된 에이전트 시스템 설계를 이해합니다.
Point 1. LLM 핵심 원리, 수식 없이 이해
ChatGPT는 쓰지만 원리가 궁금하신가요? 이 강의는 LLM의 작동 방식을 수식 없이 구조 중심으로 명확하게 설명합니다. 환각 현상의 이유부터 프롬프트, RAG, 파인튜닝, 에이전트가 왜 필요한지 그 근본 원리를 파악할 수 있습니다.
Point 2. LLM의 원리를 쉽게 이해할 수 있습니다.
단순한 툴 사용법이 아니라, LLM이 어떤 사고 구조로 작동하는지를 이해하는 데 초점을 둡니다.
이를 통해 AI 관련 회의나 기획 문서에서 등장하는 개념을 혼동 없이 이해하고 설명할 수 있는 이론적 기준을 갖게 됩니다. 또한 환각, 최신성, 컨텍스트 한계 등 LLM이 가진 구조적 한계를 이해함으로써
무엇을 기대할 수 있고, 무엇을 기대하면 안 되는지를 판단할 수 있습니다.
Point 3. RAG·파인튜닝·Agent를 이해하는 이론적 프레임
LLM이 가진 구조적 한계를 보완하기 위해 등장한 RAG 아키텍처의 핵심 구성 요소와 전체 작동 흐름를 이론적으로 이해합니다. 또한 파인튜닝과 경량 튜닝 기법(PEFT, LoRA)이 어떤 문제를 해결하기 위해 설계되었는지, 그리고 언제 적절한 선택이 되는지를 구조적으로 설명합니다. Agent 역시 “어떻게 만드는가”가 아니라, Agent가 필요한 이유와 내부 구조, 단순 자동화와 어떤 차이가 있는지를 중심으로 다룹니다.
Point 4. AI를 이해하는 관점 만들기
‘AI를 그냥 사용하는 단계’에서 벗어나 AI를 구조적으로 이해하는 관점을 만드는 데 목적이 있습니다.
토큰, 임베딩, 컨텍스트 윈도우와 같은 LLM의 핵심 개념부터, MCP, A2A 등 최신 멀티에이전트 이론까지
왜 이런 구조가 등장했는지를 중심으로 정리합니다.
✔️ LLM의 기본 원리부터 이해하고 싶은 입문자
LLM이 환각(Hallucination)을 일으키는 이유를 구조적으로 이해하고 싶으신 분
프롬프트, RAG, 파인튜닝, 에이전트가 왜 필요하며 어떻게 작동하는지 알고 싶으신 분
단순 툴 사용법을 넘어 AI의 작동 방식을 근본적으로 이해하고 싶으신 분
✔️ AI 관련 회의나 기획 문서에서 LLM 개념을 정확히 설명하고 싶은 기획자/실무자
LLM의 핵심 원리(토큰, 임베딩, 컨텍스트 윈도우)를 명확히 설명하고 싶으신 분
RAG, 파인튜닝, 에이전트 등 최신 LLM 기술 트렌드를 이해하고 싶으신 분
AI 서비스 기획 및 전략 수립 시 LLM의 한계를 고려하여 현실적인 활용 방안을 모색하고 싶으신 분
✔️ LLM을 업무에 효과적으로 적용하고 싶은 현업 개발자/데이터 분석가
LLM의 추론 및 답변 생성 과정을 구조적으로 이해하여 개발에 활용하고 싶으신 분
어떤 접근 방식(프롬프트, RAG, 파인튜닝, 에이전트)이 문제 해결에 적합한지 판단 기준을 세우고 싶으신 분
LLM의 한계(환각, 최신성, 컨텍스트)를 극복하고 실제 서비스에 적용하는 전략을 설계하고 싶으신 분
본 강의는
LLM(대규모 언어 모델)의 구조와 작동 원리를 이해하는 데 초점을 둔
이론 중심 강의입니다.
실습은 개념 이해를 돕기 위한 보조 수단입니다.
특정 AI 툴 사용법이나 실무 자동화를 목표로 하지 않습니다.
선수 지식 및 유의사항
LLM, Transformer, Self-Attention 등 핵심 개념에 대한 기본적인 이해가 있으면 좋습니다.
토큰, 컨텍스트 윈도우, 임베딩 등 관련 용어에 익숙하면 학습에 도움이 됩니다.
AI LLM의 작동 방식에 대한 호기심과 학습 의지가 중요합니다.
학습 대상은
누구일까요?
LLM과 Transformer, Self-Attention의 핵심 원리
토큰, 컨텍스트 윈도우, 임베딩 등 필수 개념 정리
프롬프트 엔지니어링 핵심 기법 (Zero-shot, Few-shot, CoT)
RAG의 전체 구조와 정확도 개선 방법
파인튜닝 vs RAG의 차이와 선택 기준
AI 에이전트의 구조와 실제 활용 시나리오
MCP, A2A 등 최신 멀티에이전트 이론 흐름
선수 지식,
필요할까요?
ChatGPT는 사용하지만 LLM 개념이 항상 헷갈리는 분
RAG·에이전트 이야기가 나오면 회의에서 이해가 안 되는 기획자·PM
AI 도입이나 활용 전략을 고민하는 현업 실무자
개발자가 아니지만 AI llm을 제대로 이해하고 싶은 분
“llm 기초이론 입문 강의 ”를 찾고 있는 학습자
5,080
명
수강생
287
개
수강평
52
개
답변
4.6
점
강의 평점
11
개
강의
AI·LLM·빅데이터 분석 전문가 / 해피AI 대표
👉상세 이력은 아래 링크에서 확인하실 수 있습니다.
https://bit.ly/jinkyu-profile
안녕하세요.
AI와 빅데이터 분석을 연구·개발·교육·프로젝트 현장에서 꾸준히 다뤄온
해피AI 대표 이진규(공학박사, 인공지능)입니다.
자연어처리(NLP)와 텍스트마이닝을 기반으로
설문, 문서, 리뷰, 언론, 정책, 학술 데이터 등
다양한 비정형 데이터를 분석해 왔으며,
최근에는 생성형 AI와 대규모 언어모델(LLM)을 활용해
조직과 업무 환경에 맞는 실무 중심의 AI 활용 방법을 전달하고 있습니다.
삼성전자, 서울대학교, 교육청, 경기연구원, 산림청,
국립공원관리공단, 서울시 등 다수의 공공기관·기업·교육기관과 협업했으며,
의료·커머스·생태·법학·경제·문화 등 다양한 도메인에서 총 200건 이상의 연구·분석 프로젝트를 수행했습니다.
📧 Email : leejinkyu0612@naver.com
🌐 Homepage : https://happyaidata.kr
📝 Blog : https://blog.naver.com/leejinkyu0612
📺 YouTube : https://www.youtube.com/@HappyAI_0612
💻 GitHub : https://github.com/leejin-kyu
📞 Mobile : 010-9973-2113
💬 KakaoTalk : jinkyu0612
※ 크몽 Prime 전문가 (상위 2%)
2024.07 ~ 현재
생성형 AI·빅데이터 분석 전문기업 해피AI 대표
공학박사(인공지능)
동국대학교 인공지능대학원
세부전공: 대규모 언어모델(LLM)
(2022.03 ~ 2026.02)
2023 ~ 2025
퍼블릭뉴스 AI 칼럼니스트
(생성형 AI 편향, RAG, LLM 활용 이슈)
2021 ~ 2023
AI·빅데이터 전문기업 스텔라비전 개발자
2018 ~ 2021
정부출연연구기관 자연어처리·빅데이터 분석 연구원
생성형 AI 및 LLM 활용
Private LLM, RAG, Agent
LoRA·QLoRA 파인튜닝 기초
AI 기반 빅데이터 분석
설문·리뷰·언론·정책·학술 데이터
자연어처리(NLP)·텍스트마이닝
토픽 분석, 감성 분석, 키워드 네트워크
공공·기업 AI 업무 자동화
문서 요약·분류·분석
LLM/sLLM 애플리케이션 개발
(파인튜닝·RAG·Agent 기반) – KT
LangChain·RAG 기반 LLM 프로그래밍 – 삼성SDS
LLM 이론 및 RAG 챗봇 개발 실무 – 서울디지털재단
ChatGPT 기반 빅데이터 분석 입문 – 렛유인에듀
인공지능 기초·프롬프트 기법 – 한국직업개발원
LDA·감성분석 with ChatGPT – 인프런
파이썬 기반 텍스트 분석 – 서울과학기술대학교
LangChain 활용 LLM 챗봇 만들기 – 인프런
ChatGPT 활용 파이썬 기초 – 경기대학교
빅데이터 전문가 과정 특강 – 단국대학교
빅데이터 분석 기초 – 렛유인에듀
Private LLM 기반 RAG 챗봇 구축 (한국전력공사)
LLM 기반 산림 복원 빅데이터 분석 (국립산림과학원)
내부망 전용 Private LLM 텍스트마이닝 솔루션 (정부기관)
Instruction Tuning·RLHF 기반 LLM 모델 개발
헬스케어·법학·정책·교육 데이터 분석
설문·리뷰·언론 데이터 AI 분석
→ 공공기관·기업·연구기관 포함 200건 이상 수행
Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms (2024)
Improving Generation of Sentiment Commonsense by Bias Mitigation
– International Conference on Big Data and Smart Computing (2023)
언론기사 빅데이터 기반 LLM 기술 인식 분석 (2024)
NLP 기반 텍스트마이닝 연구 다수
(산림·환경·사회·헬스케어 분야)
Python 기반 데이터 분석·시각화
LLM을 활용한 데이터 분석
ChatGPT·LangChain·Agent를 활용한 업무 생산성 향상
전체
27개 ∙ (1시간 31분)
1. 생성형 AI와 LLM 기초개념
01:35
2. LLM의 배경기술과 발전과정
11:33
3. LLM의 한계
03:38
6. 토큰(Token) 개념
03:20
7. 임베딩과 벡터 공간 개념
03:48
8. 컨텍스트 윈도우 개념
01:35
9. 주요 출력 제어 파라미터 소개
05:21
전체
20개
4.5
20개의 수강평
지식공유자님의 다른 강의를 만나보세요!
같은 분야의 다른 강의를 만나보세요!