강의

멘토링

로드맵

Inflearn brand logo image
Programming

/

AI Coding

Vibe Coding: Tạo ứng dụng ghi nhớ giọng nói bằng Next.js + FastAPI + Faster-Whisper

Đây là khóa học dự án thực tế về cách chạy Whisper cục bộ và phát triển nhanh chóng một ứng dụng nhận dạng giọng nói AI bằng FastAPI và Next.js. Bạn sẽ triển khai nhận dạng giọng nói theo thời gian thực và hoàn thành một sản phẩm có thể được sử dụng làm portfolio đơn giản trong một thời gian ngắn.

(3.7) 6 đánh giá

91 học viên

  • ludgi
whisper
FastAPI
nextjs
앱개발
실습 중심
Next.js
openai-whisper

Dịch cái này sang tiếng Việt

  • Next.js

  • thì thầm

  • FastAPI

  • Mã hóa Vibecoding

Dự án cuối tuần! Nhanh chóng xây dựng ứng dụng web nhận dạng giọng nói với Whisper & FastAPI

Trong khóa học này, bạn sẽ học cách chạy Whisper cục bộphát triển ứng dụng web nhận dạng giọng nói AI bằng FastAPI và Next.js.

Công nghệ này có thể được sử dụng trong nhiều lĩnh vực, bao gồm ứng dụng ghi nhớ giọng nói, hệ thống ghi âm cuộc họp thời gian thực, tạo phụ đề tự động và chatbot bằng giọng nói .

Tìm hiểu về những điều này

Nhanh hơn-Thì thầm

Cách chạy Faster-Whisper cục bộ
Tìm hiểu cách chạy mô hình Whisper cục bộ mà không cần gọi API.

Chạy Whisper trong môi trường CPU
Thông thường Whisper chạy trong môi trường GPU, nhưng hướng dẫn này sẽ hướng dẫn cách chạy nó với thiết lập chỉ có CPU . Tìm hiểu cách tối ưu hóa Whisper để sử dụng mà không cần thiết lập CUDA.

Phát triển API chuyển đổi giọng nói bằng FastAPI
Tìm hiểu cách phát triển API chuyển đổi giọng nói thành văn bản bằng FastAPI và tích hợp với Next.js để xây dựng ứng dụng web ghi nhớ giọng nói hoạt động như một dịch vụ thực sự .

Trong khóa học này, bạn sẽ học cách chạy các mô hình Whisper cục bộ và cấu hình chúng để chạy hiệu quả trên CPU . 🚀

Mã hóa rung động

Triển khai Next.js với Vibe Coding
Trong khóa học này, chúng ta sẽ triển khai toàn bộ giao diện Next.js bằng phương pháp mã hóa Vibe . Với lý thuyết và giải thích ngắn gọn, đây là cách triển khai bằng cách sử dụng cursor ai . Nói cách khác, dự án sẽ được hoàn thành ngay trong buổi thuyết trình.

Tích hợp với FastAPI và Next.js
Chúng tôi sẽ thực hành quy trình tích hợp API chuyển đổi giọng nói faster-Whisper được triển khai bằng FastAPI với giao diện Next.js. Điều này sẽ cho phép chúng ta tải giọng nói của mình lên và xuất văn bản đã chuyển đổi ra giao diện người dùng .

Hoàn thành nhanh chóng dự án bản thảo danh mục đầu tư của bạn
Bằng cách tập trung vào việc triển khai chức năng thay vì lý thuyết , bạn sẽ có một ứng dụng web nhận dạng giọng nói đơn giản vào cuối khóa học. Bạn có thể tích lũy kinh nghiệm trong thời gian ngắn và sử dụng nó để phát triển các dự án danh mục đầu tư của riêng mình.

Những điều cần lưu ý trước khi tham gia lớp học

Môi trường thực hành

  • CPU: Intel Core i7-12700K hoặc tương đương được khuyến nghị

  • RAM: Tối thiểu 8GB (khuyến nghị 16GB trở lên)

  • Dung lượng đĩa: Cần ít nhất 5 GB để tải xuống và lưu trữ các mô hình Whisper

Tài liệu học tập

  • Liên kết đến kho lưu trữ GitHub (cung cấp mã nguồn và tệp dự án)

  • Tài liệu văn bản và mẫu mã


Kiến thức và ghi chú của người chơi

  • Nếu bạn có kinh nghiệm sử dụng ngữ pháp cơ bản của Python và FastAPI, bạn sẽ hiểu nó nhanh chóng.

  • Tích hợp front-end rất dễ dàng nếu bạn có kiến ​​thức cơ bản về JavaScript và Next.js.

  • Sự quen thuộc với các khái niệm REST API và WebSocket sẽ hữu ích

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Những ai muốn tự chạy mô hình Whisper trực tiếp trên máy tính.

  • Dành cho những ai muốn phát triển dự án dựa trên AI bằng cách sử dụng FastAPI và Next.js

  • Tôi là một nhà phát triển mới vào nghề và muốn thử triển khai chức năng nhận dạng giọng nói theo thời gian thực.

  • Những bạn muốn tạo bản nháp dự án nhận dạng giọng nói AI để sử dụng cho hồ sơ cá nhân

  • Những ai muốn hoàn thành dự án trong thời gian ngắn

Cần biết trước khi bắt đầu?

  • Cú pháp cơ bản của Python (Để sử dụng FastAPI)

  • Các khái niệm cơ bản về JavaScript và React (để sử dụng Next.js)

  • Khái niệm REST API và WebSocket (dành cho liên kết backend-frontend)

Xin chào
Đây là

462

Học viên

19

Đánh giá

8

Trả lời

4.1

Xếp hạng

7

Các khóa học

안녕하세요, 주식회사 럿지의 대표입니다.


저는 스타트업, 금융권, 공공기관 등 다양한 분야에서 프로젝트를 진행하며,

개발뿐만 아니라 서비스를 직접 운영하는 경험을 쌓아왔습니다.

 

이 과정에서 팀원 및 프리랜서들과 협업하며 문제를 해결하고 프로젝트를 완성하는 능력을 길렀습니다.


특히, 단순히 개발자로서의 역할을 넘어서 자신의 서비스를 운영하고자 하는 꿈을 가진 분들께 더 많은 도움을 드릴 수 있다고 생각합니다.

 

완성의 즐거움과 성취감을 함께 경험하며 성장해 나가길 기대합니다. 감사합니다.

Chương trình giảng dạy

Tất cả

11 bài giảng ∙ (1giờ 13phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

6 đánh giá

3.7

6 đánh giá

  • 무능한아기님의 프로필 이미지
    무능한아기

    Đánh giá 2

    Đánh giá trung bình 4.0

    3

    36% đã tham gia

    처음 배우는 개념이면서 Vibe Coding에 대한 개념에 대해서 알고 관심 갖기 좋은데 환경 구축부터 전체적으로 조금 더 자세히 설명해주셨으면 좋겠습니다.

    • runiarang21님의 프로필 이미지
      runiarang21

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      45% đã tham gia

      코드 실습 위주로 강의가 진행되서 좋습니다!

      • beom_yoon94님의 프로필 이미지
        beom_yoon94

        Đánh giá 5

        Đánh giá trung bình 5.0

        5

        36% đã tham gia

        • 김성욱님의 프로필 이미지
          김성욱

          Đánh giá 2

          Đánh giá trung bình 5.0

          5

          36% đã tham gia

          • JH님의 프로필 이미지
            JH

            Đánh giá 35

            Đánh giá trung bình 3.8

            2

            45% đã tham gia

            119.577 ₫

            Khóa học khác của ludgi

            Hãy khám phá các khóa học khác của giảng viên!

            Khóa học tương tự

            Khám phá các khóa học khác trong cùng lĩnh vực!