소개
안녕하세요 AI와 빅데이터 분석에 진심인 해피AI 이진규입니다.
[강사약력]
이진규 (Lee JinKyu)
해피AI 대표 (Happy AI CEO, HappyNLP CEO)
생성 AI 및 빅데이터 분석 분야의 최신 트렌드, 인사이트, 기술 활용 방법을 깊이 있게 전달합니다.
🎒 강연 및 외주 문의
[email] leejinkyu0612@naver.com
[Blog] 📺 https://blog.naver.com/leejinkyu0612
[YouTube] 📺 https://www.youtube.com/@HappyAI_0612
[github] https://github.com/leejin-kyu/
[Homepage] https://happyaidata.kr
[H.P] 010-9973-2113
[kakao] jinkyu0612
📘 크몽 Prime 전문가(상위 2%)📺 https://kmong.com/gig/345782
삼성전자, 서울대, 교육청, 한국데이터산업진흥원, 이화여자대학교, 서울기술연구원, 경기연구원, 청운대학교,한국대기환경학회, 국립공원관리공단, 서울디지털재단, 세종대학교, 전남대학교 등 다수의 정부기관 및 교육기관 프로젝트 진행
의료,커머스,생태,법학,경제,예체능 등 다양한 도메인의 연구경험(총 연구 프로젝트 200회 이상 진행)
📘 Bio
- 2024.07~ 생성 AI 및 빅데이터 분석 전문기업 해피AI 대표
- 2023.01~ 생성 AI 기반 빅데이터 분석 전문기업 해피NLP
- 2022. 동국대학교 AI대학원 박사과정 수료(자연어처리 및 LLM 전공)
- 2023~ 퍼블릭 뉴스 AI 칼럼니스트(AI편향 및 RAG챗봇 전문)
- 2021~2023 AI/빅데이터 전문 기업 스텔라비전 개발자
- 2018~2021 공공기관 자연어처리/빅데이터 분석 연구원 (인문사회과학 데이터 연구)
- 2021 자연어처리/빅데이터 전문기업 Textom 최우수 Analyst
🎒Courses & Activities
2024
Langchain 및 RAG 등 LLM 프로그래밍.삼성SDS(2024)
ChatGPT 기반 빅데이터 분석 입문. 렛유인에듀 (2024)
인공지능 기초 및 데이터 분석 기초 강의. 한국직업개발원 (2024)
LLM 실무자를 위한 LLM이론 및 Langchain 기반 RAG챗봇 개발 강의. 서울디지털 재단 (2024)
텍스톰(Textom)을 활용한 텍스트마이닝(연구동향, SNS) 논문 작성법 강의. 인프런 (2024)
쉽게 따라하는 LDA & 감성분석 빅데이터 논문 작성법 with ChatGPT. 인프런 (2024)
파이썬을 활용한 텍스트 분석 강의. 서울과학기술대학교 (2024)
파이썬 초보자를 위한 주가 데이터 분석 입문 강의. 인프런 (2024)
연구자와 대학원생을 위한 감성분석 기법 실습 강의. 인프런 (2024)
랭체인(LangChain)을 활용한 LLM 챗봇 만들기(feat.ChatGPT). 인프런 (2024)
2023
ChatGPT를 활용한 파이썬 기초 강의. 경기대학교 (2023)
빅데이터 전문가 과정 특강. 단국대학교 (2023)
빅데이터 분석 기초 강의. 렛유인에듀 (2023)
💻 Projects
첨단바이오 분야 LLM-AI 활용을 위한 관련 데이터 전처리, 연계 기능 구현(
한국과학기술정보연구원,KIST)
LLM 기반 산림 복원 빅데이터 분석(국립산림과학원)
Private LLM 기반 RAG 챗봇 모델 구축 (한국전력공사)
AI 기반 빅데이터 분석 기법을 적용한 설문 데이터 분석 (A정부기관)
빅데이터 분석 기법을 통한 이용자 설문 데이터 분석 및 시각화 (코멘터리 사무소)
내부망 전용 LLM을 활용한 텍스트마이닝 솔루션 개발 (D 정부기관)
빅데이터 분석을 통한 한우시장 트렌드 분석 (이화브리오)
Instruction Tuning 및 강화학습(RLHF)을 통한 LLM 모델 개발 (서울디지털재단)
AI 언어모델 기반 헬스케어 서비스의 사용자 리뷰 텍스트 분석 (삼성전자)
단어 임베딩 유사도를 활용한 Word2Vec 언어 모델 기반의 텍스트마이닝 기법을 활용한 설문 빅데이터 분석 (정림건축)
AI 언어 모델 기반 텍스트마이닝 기법을 활용한 SNS 인식 분석 (LMC)
자연어 처리 기술 기반 텍스트마이닝을 활용한 연구동향 분석 (한국대기환경학회)
AI 모델 kopatBERT 기반 특허 논문 QA 모델 개발 (한국기술마켓)
자연어 처리 기법을 활용한 설문 질적연구 자료 분석 (청운대학교)
AI 모델 kopatBERT 기반 특허 논문 분류 모델 개발 (한국기술마켓)
딥러닝 기반 토픽모델링을 활용한 법학 설문 빅데이터 분석 (서울대학교)
딥러닝 및 머신러닝 기반 텍스트 분석 기법을 활용한 간호 설문 질적연구 자료 분석 (충북대학교)
KorQuad를 활용한 BERT 기반 금융권 QA task 모델링 (B사)
학술 데이터의 특성에 따른 Bert 기반 Multi-classification 모델 개발 (A사)
인공지능 자연어 처리(NLP) 분야에 대한 최신 트렌드 및 기술 경향 분석 (Textom)
AI 모델 Word2Vec 및 TF 기반 의료 설문 빅데이터 Keyword 추출 알고리즘 개발 (D사)
AI 모델 Word2Vec과 감성분석을 적용한 설문 문항 빅데이터 분석 (경기연구원)
딥러닝 기반 비대면 진료 관련 언론기사 토픽 분석 (한국보건의료연구원)
언론보도 분석을 통한 캠핑 트렌드 인사이트 도출 (한국관광컨설팅)
AI 모델 RNN 기반 리뷰 인사이트 추출 및 분석 프로그램 개발 (서클플랫폼)
주요 언론사 빅데이터 분석을 통한 안전사고 유형 분석 (서울기술연구원)
뉴스 빅데이터 분석을 통한 '나는 SOLO' 인기 요인 분석 (Textom)
우크라이나 러시아 전쟁에 대한 국민인식 분석 (Textom)
주요 도서 카테고리별 크롤링 프로그램 개발 및 빅데이터 분석 (데이원컴퍼니)
AI 모델 Word2Vec 기반 텍스트마이닝 솔루션 프로그램 개발 (서클플랫폼)
데이터 인력 분석을 위한 정보 수집 프로그램 개발 및 빅데이터 분석 (한국데이터산업진흥원)
헬스케어 스토어 상품 리뷰 분석 (오므론헬스케어)
기업 인터뷰 설문 빅데이터 분석 (인피플컨설팅)
빅데이터 분석을 통한 여성원피스에 대한 니즈 분석 (Textom)
NLP 기법을 활용한 정맥간호 관련 인식 분석 (울산대학교)
빅데이터 분석을 통한 인공지능에 대한 언론 보도경향 분석 (Textom)
빅데이터 분석을 통한 축산물 트렌드 파악 및 분석 (중원푸드)
빅데이터를 활용한 2022년 국립공원 탐방 키워드 분석 (국립공원관리공단)
빅데이터 분석을 통한 서울맛집에 대한 인식 분석 (Textom)
빅데이터 분석을 통한 재테크에 관한 언론보도 분석 (Textom)
언론보도 분석을 통한 '골때리는 그녀들'에 대한 인기 요인 도출 (Textom)
쇼팽 콩쿠르에 대한 언론보도 동향 분석 (Textom)
월드컵 최종예선에 대한 국민인식 분석 (Textom)
위드코로나에 대한 국민인식 분석 (Textom)
(언론보도자료) 빅데이터를 통해 본 국내 주요 숲길의 인기 비결 (국립산림과학원)
(언론보도자료) 빅데이터가 말하는 인제 자작나무 숲의 인기 비결 (국립산림과학원)
빅데이터 분석을 통한 숲길 네트워크 구축 및 관리방안 도출 연구 (국립산림과학원)
해외 휴양공간 빅데이터 제공 시설 구성요소 및 위계 분석을 통한 정보 서비스 체계 구축 (국립산림과학원)
빅데이터 분석을 통한 산림휴양공간 핫스팟 지역 수요 예측 및 관리 기술 개발 (국립산림과학원)
국내 주요 산림휴양공간별 빅데이터 분석을 통한 네트워크 체계 구축 및 중·장기 운영관리 로드맵 제시 (국립산림과학원)
데이터 마이닝을 통한 산림 휴양공간 이용자 인식 도출 및 운영관리방안 설계 (국립산림과학원)
GIS 공간데이터 및 비정형 텍스트 정보 자료 분석을 통한 DMZ 숲길 최적 노선 기술 개발 및 현장 적용성 검토 (국립산림과학원)
이외에도 다수의 공공기관, 기업체와 개인적 의뢰 등 총 200건 이상 프로젝트 진행
📖 Publication
Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms.IEEE Access, JinKyu Lee, and Jihie Kim.2024. 논문 링크
Improving Generation of Sentiment Commonsense by Bias Mitigation" International Conference on Big Data and Smart Computing (BigComp). JinKyu Lee, and Jihie Kim.2023. 링크
Vanilla 프롬프팅 기법과 CoT 프롬프팅 기법 간 음악 편곡 결과 비교 분석 | 게임학회 | 2024
언론기사 빅데이터 분석을 통한 대규모 언어모델에 대한 기술 인식 분석: ChatGPT 등장 전후를 중심으로 | 한국멀티미디어학회 | 2024 논문 링크
정맥간호 인터넷 카페 Q & A 게시글의 키워드 네트워크 분석 | Healthcare Informatics Research | 2023.02 논문 링크
자연어 처리(NLP)기반 텍스트마이닝을 활용한 소나무에 대한 국내외 연구동향(2001∼2020)분석 | 농업생명과학연구 | 2022 논문 링크
텍스트마이닝을 활용한 백두대간에 관한 연구동향(2001‒2020) 분석 | 한국산림과학회지 | 2022 논문 링크
텍스트마이닝을 활용한 국내 산림생태 분야 연구동향(2001‒2020) 분석 | 한국산림과학회지 | 2022 논문 링크
(NLP) 편향(Bias) 완화를 통한 감성 상식(Commonse)문장 생성 향상 기법 연구 (BART모델 사용) 논문 링크
숲길에 대한 10 년간의 언론 인식분석-텍스트 마이닝 분석을 중심으로 | 산림경제연구 | 2021
산림관광지로서 인제 자작나무 숲에 대한 소셜미디어 이용자 인식 연구 | 한국산림휴양학회 | 2020
이외에도 타 분야에서 다수의 학술논문, 학술발표, 연구보고서 등의 성과 창출
Others
Python을 활용한 데이터분석 및 시각화
LLM을 활용한 데이터분석
ChatGPT와 LangChain을 활용한 업무 생산성 향상
강의
수강평
- [무료]텍스톰 TEXTOM 24 신버전 기초 강의: 빅데이터 논문 작성을 위한 SNS 인식 분석
- AI연구자가 알려주는 ChatGPT를 활용한 파이썬 기초 문법
게시글
질문&답변
BERTopic에 대해서 질문드립니다.
형태소 분석 된 정제 파일로 돌리셔야 합니다^^
- 0
- 2
- 12
질문&답변
TF-IDF값에 대해서 질문드립니다.
일반적으로 TF-IDF 값이 0.몇으로 나오는 경우는 TF-IDF 값을 벡터 정규화했기 때문입니다. 현재 코드는 정규화를 적용하지 않고, 단어별 TF-IDF 값을 단순 합산한 결과입니다.
- 0
- 3
- 16
질문&답변
수업 자료 관련
안녕하세요 혹시 강의 수강 중이실까요? 수강 중이라면 수업 자료 파일을 다운 받는 github 주소를 안내하고 있습니다.
- 0
- 2
- 48
질문&답변
텍스톰으로 Bertopic을 사용할 수는 없나요?
안녕하세요 텍스톰에서는 Bertopic을 지원하지 않습니다^^;; 파이썬으로 bertopic을 코딩해야지 가능하며 파이썬을 활용한 빅데이터 분석 강의를 제가 오픈해놓았으니 참고바랍니다.
- 0
- 2
- 51
질문&답변
원하는 결과를 얻기 위한 데이터 전처리 관련
안녕하세요 주어진 코드를 돌리면 정제파일이 생성되는데요 이 새로 생성된 정제파일을 가지고 빈도분석 등 여러 분석을 진행하셨는지요? 기존의 파일로 실행이 됬을 가능성이 높습니다.시민을 A열에 B열에 지역주민, 주민을 A열에 B열에 지역주민으로 지정하면 됩니다^^
- 0
- 1
- 95
질문&답변
포털과 학술데이터 모두 활용할때
네 안녕하세요텍스톰에서 내 데이터를 업로드할때 1개를 업로드하였죠?마찬가지로 포털와 학술데이터를 엑셀 데이터 1개 파일에 이어서 붙여 넣는식으로 해서 업로드 하시면 됩니다. 감사합니다.
- 0
- 1
- 83
질문&답변
강의화면 표시문제
네 제가 확인하기로는 모든 강좌가 화면이 나오는 걸로 확인되는데도. . 혹시 강좌명도 알려주시면 좀 더 세부적으로 검토하겠습니다.
- 0
- 1
- 82
질문&답변
LDAvis 시각화가 되지 않습니다.
네 안녕하세요 현재 구글 Colab과 Ldavis 라이브러리간 버전 호환 충돌이 빈번히 발생하고 있는데요.Colab의 Pandas 라이브러리가 업데이트 되어서 그런듯합니다.버전을 검토 중이어서 수정사항에 대해 답변 드리도록 하겠습니다. 일단 Vscode로 제가 드린 코드를 실행하시는걸 추천드립니다.(아래 링크 참조)Visual Studio Code 설치 및 사용법 완벽 정리(feat. 파이썬 연동) (tistory.com)
- 0
- 2
- 158
질문&답변
샘플로 제시해 주신 참고문헌 제공 부탁드리겠습니
안녕하세요 답변을 늦게 보았네요^^;;아래는 인프런의 AI가 답변한 것이고 참고문헌은 아래오 ㅏ같스빈다. Lee, Seung Eun,2022,Study of Korean Modern Cookbooks Using Text Mining Analysis, Department of Nutritional Science & Food Management The Graduate School Ewha Womans University SeoulJang M, OH S and Kim UM. 2018. Article analytic and summarizing algorithm by facilitating TF-IDF based on k-means. Proceedings of the Korea Information Processing Society Conference 2018(0):271–274.Kang, D.J and Lee, K.N., 2015, A Study on Co-author Networks of Journal of Korea Trade Research Association using Social Network Analysis. Korea Trade Research Association 40(5): 1-23.Yoo JY, Kim JY and Baek HS. 2019. Bibliometric analysis on studies of Korean intangible cultural property dance: focusing on events in the Seoul area. Journal of the Korea Entertainment Industry Association 13(4): 139-147.
- 0
- 3
- 241
질문&답변
유씨넷 프로그램 설치
안녕하세요 제가 답변을 늦게 보았습니다^^;; ucinet은 유료가 아니라 무료로 사용할 수 있습니다. 감사합니다.
- 0
- 2
- 288