GPT API를 활용한 Youtube 영상 요약 AI 만들기
Essential
복잡한 GPT API와 파이썬을 가장 쉽게 실습 중심으로 익히는 것을 목표로 합니다. 최신 ChatGPT API를 활용하여 유튜브 영상 요약 AI를 개발하고, 이를 Streamlit으로 구성해 웹 애플리케이션 형태로 구현합니다.
Basic
Python, 빅데이터, 인공지능(AI)
본 강의는 Node.js와 TypeScript 환경에서 최신 Gemini API SDK(@google/genai)를 다루는 것을 목표로 합니다. 텍스트, 이미지, 비디오를 동시에 처리하는 멀티모달 기술을 사용하는 방법을 배웁니다. API 키 발급부터 프로젝트 세팅, 모델 호출까지 전 과정을 실습합니다.
3명 이 수강하고 있어요.
난이도 입문
수강기한 무제한
TypeScript + Gemini API 사용법
Text 생성 (Config 설정, 멀티모달, 스트리밍, 멀티턴, Tool, Function call, 코드 실행, 스키마 출력)
Image 생성 (Text to Image, Image to Image, Image with Tool)
최신 Gemini API SDK를 Node.js와 TypeScript 환경에서 자유롭게 다루며,
멀티모달 AI 기술을 실제 서비스에 적용할 수 있는 개발자로 성장합니다.
최신 LLM 기술을 실제 서비스에 적용하고 싶은데,
어떤 API를 어떻게 활용해야 할지 막막하신가요?
텍스트, 이미지를 넘어 비디오까지 한 번에 처리하는
Gemini의 강력한 멀티모달 기능을 직접 구현하고 싶으신가요?
ChatGPT를 넘어 Gemini API를 활용하는 방법을 배워보고 싶으신가요?
이 강의를 통해 Gemini API를 완벽하게 마스터하고
AI 기반의 혁신적인 서비스를 직접 만들어나갈 수 있습니다.
실무 서비스 개발에 바로 적용 가능한 AI 활용 능력을 키워,
최신 LLM 기술을 선도하는 개발자로 성장하세요.
TypeScript와 Gemini API 활용 능력을 즉시 갖춥니다.
Node.js와 TypeScript 환경에서 최신 Gemini API SDK를 능숙하게 다루는 방법을 배웁니다. API 키 발급부터 프로젝트 설정, 멀티모달 데이터 처리, 다양한 텍스트 및 이미지 생성 기능까지, 강의에서 제시하는 실습을 통해 실무에서 바로 적용 가능한 기술 스택을 완성합니다.
멀티모달 인공지능 서비스를 스스로 기획하고 구현할 수 있습니다.
텍스트, 이미지, 비디오 등 다양한 형태의 데이터를 동시에 처리하는 Gemini API의 멀티모달 기능을 활용하여, 한층 더 발전된 AI 서비스를 직접 구축하게 됩니다. 스트리밍, 멀티턴 대화, 함수 호출 등 고급 기능을 자유자재로 활용하여 창의적인 서비스 구현 능력을 갖추게 됩니다.
Gemini API의 핵심 기능을 정확하게 이해합니다.
Gemini API의 텍스트 생성, 이미지 생성(Text to Image, Image to Image)과 같은 주요 기능들을 상세한 예제를 통해 익힙니다. 각 기능의 설정 방법과 활용 시 고려사항을 명확히 이해하여, 어떤 상황에서도 최적의 AI 모델을 선택하고 활용하는 안목을 기릅니다.
AI 기술 도입에 대한 자신감을 얻고 전문가로 성장합니다.
복잡하게만 느껴졌던 최신 AI 기술을 쉽고 체계적으로 학습하며 자신감을 얻습니다. Gemini API를 활용한 서비스 구축 경험을 통해 AI 개발자로서의 역량을 강화하고, 실제 서비스 개발 과정에서 마주할 수 있는 다양한 문제에 대해 스스로 해결책을 찾아나가는 능력을 갖추게 됩니다.
본 강의는 Node.js 및 TypeScript 환경에서 최신 Gemini API SDK를 활용하는 방법을 집중적으로 다룹니다. 텍스트, 이미지, 비디오를 넘나드는 멀티모달 기술을 API 키 발급부터 실제 모델 호출까지 전 과정에 걸쳐 실습하며 익힐 수 있습니다.
Gemini API를 사용하여 텍스트 생성, 이미지 생성(Text to Image, Image to Image) 등 다양한 기능을 직접 구현해봅니다. Node.js와 TypeScript를 기반으로 멀티모달 데이터를 처리하고, 구글의 최신 AI 기술을 실무 서비스에 적용하는 경험을 쌓게 됩니다.
강의에서는 @google/genai 라이브러리를 사용하여 Gemini API를 연동합니다. 프로그래밍 환경 설정부터 API 호출, 응답 처리까지 모든 과정을 직접 코드로 작성하며, 학습한 내용을 즉시 적용할 수 있는 실습 환경을 제공합니다.
TypeScript와 Gemini API를 활용하여
멀티모달 AI 서비스를 구축하고 싶지만, API 연동 및 프로젝트 설정에 어려움을 겪고 있는 개발자
텍스트뿐만 아니라 이미지, 비디오 등 다양한 형태의 데이터를 처리하는
최신 Gemini API의 멀티모달 기능을 이해하고 실제 서비스에 적용할 방안을 모색 중인 기획자
기존 TypeScript 프로젝트에
Gemini API를 연동하여 챗봇, 이미지 분석 등 AI 기능을 추가하고 싶지만, 백엔드 연동 경험이 부족한 개발자
실습 환경
운영체제: Windows
개발 도구: Node.js (최신 LTS 버전 권장), Visual Studio Code (또는 선호 IDE)
선수 지식 및 유의사항
JavaScript 및 TypeScript 기본 문법 이해가 필요합니다.
Node.js 환경에서의 프로젝트 설정 경험이 있으면 좋습니다.
API 키 발급 및 보안 관리에 유의해야 합니다.
학습 자료
Gemini API 공식 문서 및 예제 코드
학습 대상은
누구일까요?
TypeScript 환경에서 최신 LLM 기술이 적용된 실무 서비스를 구축하려는 개발자
이미지, 비디오, 오디오 등 멀티모달 데이터를 다루고자 하는 엔지니어
선수 지식,
필요할까요?
TypeScript/JavaScript 기초 문법
264
명
수강생
41
개
수강평
1
개
답변
4.8
점
강의 평점
9
개
강의
프로그래밍의 핵심과 본질을 쉽게 이해할 수 있도록
체계적인 커리큘럼과 개념 정리를 제공하며,
Python과 JavaScript, Kotlin 등 다양한 프로그래밍 언어와
React, Spring, FastAPI 등의 프레임워크 기술
LangChain, n8n과 같은 AI 기술 들을 친절하게 알려드립니다.
실용적인 예제와 실무 적용 방법을 안내합니다.
효율적인 학습을 위해 꼭 필요한 내용만 담아 빠르게 이해하고 적용할 수 있는 강의를 제공합니다.
전체
5개 ∙ (44분)
3. Text 생성하기 - 1
10:30
4. Text 생성하기 - 2
15:10
5. Image 생성하기
07:22
얼리버드 할인 중
₩12
35%
₩24,200
지식공유자님의 다른 강의를 만나보세요!
같은 분야의 다른 강의를 만나보세요!