inflearn logo

PostgreSQL của nhà phát triển AI tại Thung lũng Silicon, người xử lý hơn 200 tỷ dữ liệu

Đây là khóa học giúp bạn trau dồi kỹ năng sử dụng PostgreSQL cần thiết trong kỷ nguyên AI dưới góc nhìn thực tiễn, vượt xa mức độ CRUD đơn thuần. Dựa trên kinh nghiệm phát triển AI tại Thung lũng Silicon, bạn sẽ được học từng bước cách thiết kế và vận hành JSON, Index, Transaction cho đến pgvector trong các dịch vụ thực tế, từ đó nắm vững phương pháp giải quyết các cấu trúc dữ liệu phức tạp và vấn đề về hiệu suất.

(5.0) 2 đánh giá

91 học viên

Độ khó Nhập môn

Thời gian Không giới hạn

MySQL
MySQL
PostgreSQL
PostgreSQL
Oracle
Oracle
DBMS/RDBMS
DBMS/RDBMS
database
database
MySQL
MySQL
PostgreSQL
PostgreSQL
Oracle
Oracle
DBMS/RDBMS
DBMS/RDBMS
database
database

Đánh giá từ những học viên đầu tiên

5.0

5.0

warna

92% đã tham gia

Tôi nghĩ đây thực sự là một bài giảng ở đẳng cấp rất hiếm thấy.. Tôi mới chỉ từng sử dụng MySQL thôi, nhưng qua đây tôi đã hiểu rõ hơn về sức hấp dẫn của PostgreSQL. Cảm ơn bạn vì nội dung tuyệt vời này.

5.0

02년생 개발자

95% đã tham gia

Đây là người chia sẻ kiến thức duy nhất trên Inflearn mà tôi luôn bật thông báo và theo dõi sát sao... Thầy luôn giảng giải lý thuyết thông qua nhiều hình ảnh minh họa đa dạng, và đúng như phần giới thiệu, 90% khóa học là thực hành. Chính vì vậy mà tôi thấy nó càng hữu ích và thú vị hơn. Thay vì những bài giảng rập khuôn, thầy luôn dạy một cách thực tế nên rất hợp với phong cách của tôi. (Dù thỉnh thoảng thầy có mắc lỗi ㅋㅋㅋ nhưng thầy cũng thừa nhận một cách rất ngầu). Tôi cũng đang tham gia cộng đồng, thầy luôn chia sẻ những thông tin hữu ích và trả lời mọi thắc mắc một cách rất thân thiện, thực sự tôi đã học hỏi được rất nhiều. Luôn cảm ơn thầy rất nhiều. Tôi cũng hay viết đánh giá khóa học nhưng đây là lần đầu tiên tôi viết dài như thế này!!

Bạn sẽ nhận được điều này sau khi học.

  • Khả năng thiết kế cơ sở dữ liệu dựa trên PostgreSQL và thiết kế cấu trúc bảng

  • Khả năng viết SQL tập trung vào thực tiễn và vận dụng các mẫu truy vấn, chỉnh sửa, xóa dữ liệu.

  • Năng lực tối ưu hóa hiệu suất sử dụng Index, JOIN và truy vấn tổng hợp

  • Khả năng xử lý dữ liệu trong kỷ nguyên AI sử dụng JSONB, các tính năng mở rộng và pgvector

  • Hiểu về mô hình hóa dữ liệu thực tiễn và quan điểm vận hành dựa trên PostgreSQL

  • Các Plugin đa dạng trong hệ sinh thái PostgreSQL

PostgreSQL cho kỷ nguyên AI... Được chia sẻ bởi nhà phát triển AI từ Thung lũng Silicon!.

  • Nội dung dưới đây là nội dung cuộc trò chuyện thực tế.


😄 Nhà phát triển đến từ Thung lũng Silicon : Có lẽ.. đã một thời gian kể từ khi tôi tham gia và quan sát nhiều thứ, tôi có một chủ đề muốn thảo luận.. liệu có ổn không ạ??

😁 Nhà phát triển Toss : Tôi thì lúc nào cũng ok với anh mà ㅋㅋㅋㅋ Hong ơi làm việc thôi

😁 Người phỏng vấn Kakao : Ồ!! Tôi cũng đang mong chờ xem bạn sẽ thực hiện chủ đề nào đây!! Bạn dự định sẽ thực hiện chủ đề gì vậy??

😄 Nhà phát triển đến từ Thung lũng Silicon : Về DB thì ㅎㅎ tôi định sẽ sử dụng PostgreSQL!! Vì nó cung cấp pgvector nên có thể tận dụng rất tốt trong kỷ nguyên AI mà không bị phụ thuộc quá nhiều nên là...

😁 Người phỏng vấn Kakao : Ồ, tôi cũng mới chỉ nghe nói về cái đó chứ chưa dùng thử bao giờ.. Tôi cũng sẽ thử thanh toán và dùng xem sao nhé ㅎㅎ

😁 Nhà phát triển Toss : kkkk Cứ tin tưởng mà theo thôi, anh ấy thực sự giỏi lập trình lắm, góc nhìn cũng rất rộng nữa

😄 Hong : Á... lại một lần nữa anh cho em thử thách này sao... Em chỉ tin tưởng và đi theo các anh thôi kkkk. Anh cứ tổng hợp lại rồi gửi cho em, chúng ta sẽ cùng xem xét và tiến hành nhé!!

MySQL, PostgreSQL, Oracle, DBMS/RDBMS, database

⚡ Tại sao PostgreSQL lại được săn đón trong kỷ nguyên AI vậy nhỉ??

Tại sao PostgreSQL lại được săn đón trong kỷ nguyên AI? Đó là bởi vì các cơ sở dữ liệu trước đây chủ yếu tập trung và chú trọng vào vai trò lưu trữ và truy vấn dữ liệu có cấu trúc. Tuy nhiên, trong thời đại hiện nay của chúng ta, tình thế đã hoàn toàn thay đổi. Với sự xuất hiện của các dịch vụ AI, chúng ta không còn chỉ xử lý các dữ liệu bảng đơn thuần nữa.

  • Dữ liệu phi cấu trúc dưới dạng JSON

  • dữ liệu log

  • Dữ liệu vector dựa trên embedding

Môi trường cần phải xử lý cùng nhau đã được thiết lập và đang trở nên cần thiết.

Trong khóa học này, chúng ta sẽ từng bước tìm câu trả lời cho những câu hỏi đó từ những kiến thức cơ bản đến nâng cao của PostgreSQL.
Vượt xa hơn cả cú pháp SQL đơn thuần, bạn có thể xử lý mọi thứ chỉ với PostgreSQL mà không cần thêm các phụ thuộc khác, từ việc cấu hình schema linh hoạt thông qua JSONB, duy trì hiệu suất trên các tập dữ liệu lớn thông qua lập chỉ mục (indexing), cho đến tìm kiếm tương đồng dựa trên AI thông qua các tiện ích mở rộng như pgvector.

Điều này có nghĩa là chỉ với một PostgreSQL duy nhất, bạn có thể đáp ứng đầy đủ các yêu cầu xử lý dữ liệu cần thiết trong kỷ nguyên AI mà không cần phải duy trì nhiều hệ thống riêng biệt. Thông qua thời gian này, tôi hy vọng bạn sẽ chuẩn bị để trở thành một nhà phát triển có thể sẵn sàng cho kỷ nguyên AI. 🚀

🌳 Tại sao lại là PostgreSQL

Hiện tại, hầu hết các nhà phát triển backend đều đang gặp phải những vấn đề tương tự. Ban đầu mọi thứ bắt đầu rất đơn giản.
Chỉ cần một MySQL là đủ, và chỉ cần các thao tác CRUD hoạt động tốt thì không có vấn đề gì. Tuy nhiên, tình hình sẽ thay đổi khi dịch vụ chỉ cần phát triển lớn hơn một chút.

  • Khi bắt đầu tích lũy log, bạn sẽ bắt đầu cân nhắc về một kho lưu trữ riêng biệt

  • Khi chức năng tìm kiếm được thêm vào, Elasticsearch cũng được tích hợp theo

  • thêm Redis để xử lý thời gian thực

  • Khi định thêm các tính năng AI, bạn lại thấy mình cần phải thêm cả Vector DB nữa

Và đến một lúc nào đó, bạn sẽ nhận ra.

👉 “Mình không phải đang xây dựng tính năng, mà là đang bảo trì hệ thống”

PostgreSQL có những đặc điểm sau đây.

Xử lý giao dịch mạnh mẽ dựa trên ACID
→ Đảm bảo tính nhất quán của dữ liệu một cách triệt để, có thể sử dụng ổn định ngay cả trong các hệ thống quan trọng như tài chính và thanh toán

MVCC (Kiểm soát đa phiên bản đồng thời)
→ Việc đọc và ghi không ngăn cản lẫn nhau, giúp đảm bảo tính đồng thời và hiệu suất cao một cách tự nhiên

Tính năng tối ưu hóa truy vấn và chỉ mục phong phú
→ Hỗ trợ nhiều loại chỉ mục khác nhau như B-Tree, GIN, GiST, giúp xử lý hiệu quả ngay cả các truy vấn phức tạp

Khả năng mở rộng (Extensibility)
→ Có thể mở rộng cơ sở dữ liệu một cách linh hoạt thông qua các hàm tự định nghĩa, kiểu dữ liệu và các mô-đun mở rộng.

Tuân thủ chuẩn SQL + Khả năng tương thích cao
→ Cung cấp rộng rãi các tính năng mạnh mẽ cần thiết trong thực tế trong khi vẫn bám sát các tiêu chuẩn

Hỗ trợ nhiều loại dữ liệu khác nhau như JSON / GIS
→ Có thể xử lý từ dữ liệu quan hệ đơn thuần đến dữ liệu bán cấu trúc và dữ liệu dựa trên vị trí chỉ với một DB duy nhất

Bản thân hệ sinh thái PostgreSQL đã có khả năng mở rộng hoàn hảo

→ Tận dụng các Plugin đa dạng (pgvector, postgis, pgsearch, v.v.) để áp dụng các mô hình sử dụng Database có khả năng mở rộng phù hợp với từng tình huống cụ thể.

Trong tài liệu chính thức, PostgreSQL được mô tả như sau.

PostgreSQL là một hệ quản trị cơ sở dữ liệu đối tượng - quan hệ mã nguồn mở mạnh mẽ, nổi tiếng với độ tin cậy cao, tính năng phong phú và hiệu suất vượt trội.

-> PostgreSQL là một hệ thống cơ sở dữ liệu đối tượng - quan hệ mã nguồn mở mạnh mẽ, nổi tiếng với độ tin cậy cao, tính năng phong phú và hiệu suất vượt trội.

PostgreSQL không chỉ đơn thuần là một kho lưu trữ dữ liệu, mà còn cung cấp sẵn nhiều tính năng đa dạng phục vụ cho việc xử lý dữ liệu phức tạp và mở rộng. Thông qua tính toàn vẹn của giao dịch, lập chỉ mục nâng cao, kiến trúc có thể mở rộng và các tính năng đa dạng vượt xa chuẩn SQL thông thường, nó cho phép quản lý dữ liệu một cách ổn định và linh hoạt. PostgreSQL cho phép khai thác dữ liệu nâng cao vượt ra ngoài các thao tác CRUD đơn thuần. Đây là một cơ sở dữ liệu hoạt động ổn định ngay cả trong các hệ thống quy mô lớn, và có thể được ứng dụng trong nhiều môi trường khác nhau nhờ thiết kế cân nhắc đồng thời cả tính mở rộng lẫn hiệu suất.

Trong các hệ thống backend hiện đại, việc chỉ đơn thuần "lưu trữ" dữ liệu là chưa đủ.

👉 Dữ liệu ngày càng trở nên phức tạp
👉 Lưu lượng truy cập không ngừng tăng lên
👉 Đồng thời yêu cầu cả tính nhất quán và hiệu suất

Chính trong những tình huống như thế này, việc lựa chọn cơ sở dữ liệu nào và hiểu sâu về nó đến mức nào sẽ quyết định năng lực của một nhà phát triển.

Thông qua khóa học này, hy vọng bạn sẽ hiểu PostgreSQL không chỉ đơn thuần là một “DBMS”, mà là một công nghệ cốt lõi giúp xử lý dữ liệu phức tạp một cách hiệu quả và chịu trách nhiệm cho sự ổn định của hệ thống, từ đó có được năng lực thiết kế và tối ưu hóa dữ liệu để áp dụng ngay vào thực tế. 🚀

🍡 Xem trước nội dung bài giảng thực tế TODO

Tokenizer sử dụng Search Extension

Thực hành tổng hợp sử dụng cron & phân tán sharding

Thử phân tích truy vấn trong môi trường phân tán

Thực hành snapshot theo từng phiên dựa trên mức độ cô lập

Lý do tại sao khóa học này đặc biệt và tại sao bạn nhất định phải tham gia

📌 Khóa học được xây dựng dựa trên câu hỏi phỏng vấn và bí quyết của nhà phát triển thực thụ đến từ Thung lũng Silicon

  • Đây là bài giảng được xây dựng cùng với các nhà phát triển đương nhiệm đang xây dựng sự nghiệp tại Thung lũng Silicon. Tôi hy vọng bạn sẽ học hỏi được những quan điểm và mẹo hữu ích từ những nhà phát triển có kinh nghiệm dày dặn trong việc xử lý thực tế với PostgreSQL.

📌 Hơn 90% là thực hành và cấu trúc bài giảng thông qua mã nguồn

  • Tất cả các bài giảng đều cung cấp các câu lệnh truy vấn PostgreSQL thực tế, và nội dung bài giảng được lồng ghép một cách tự nhiên cùng với các phần thực hành. Thông qua đó, mức độ hiểu biết và hiệu quả học tập của các bạn sẽ được nâng cao hơn một bậc.

📌 Con đường tắt từ Junior lên Senior..! -> Định hướng dưới góc độ Cơ sở dữ liệu

  • Những nội dung về các mẫu từ cơ bản đến nâng cao được chia sẻ bởi các nhà phát triển tài năng đang thực sự sử dụng PostgreSQL tại Thung lũng Silicon sẽ cung cấp cho bạn mọi thứ, không thiếu dù chỉ 1% trong việc sử dụng PostgreSQL.


📌 Những ai tò mò về vai trò của PostgreSQL trong kỷ nguyên AI

  • PostgreSQL sẽ cung cấp những dịch vụ gì trong kỷ nguyên AI?? Truy vấn tìm kiếm vector embedding sử dụng pgvector!! Bạn có thể cùng học về nội dung này thông qua thời gian này.

Rất khuyến khích những đối tượng sau đây nên tham gia khóa học 👨‍🏫

🎯  PostgreSQL Các nhà phát triển trình độ sơ - trung cấp muốn củng cố vững chắc nền tảng cơ bản

  • Những người muốn học một cách có hệ thống về nhiều mẫu INSERT/UPDATE/DELETE khác nhau, tối ưu hóa SELECT và cách sử dụng chỉ mục (index) thay vì chỉ dừng lại ở các thao tác CRUD đơn giản.

🎯 PostgreSQL được sử dụng như thế nào, dành cho các nhà phát triển Backend đang thắc mắc 

  • Những ai tò mò về các khái niệm cơ bản nhất trong việc học PostgreSQL như DDL và DML, cũng như các góc nhìn đa dạng có thể áp dụng ngay vào thực tế.


🎯 Sinh viên mới tốt nghiệp đang tìm việc hoặc lập trình viên Junior mảng Backend cần chuẩn bị cho phỏng vấn

  • Nhà phát triển muốn hệ thống lại các chủ đề phỏng vấn điển hình như Transaction DB, tính toàn vẹn, Index, FK theo tiêu chuẩn thực tế.

🎯 PostgreSQLNhững nhà phát triển định hướng cấp cao muốn xem PostgreSQL là 'cấu trúc cốt lõi của hệ thống'

  • Những ai muốn hiểu MySQL không chỉ là một kho lưu trữ đơn thuần mà là một thành phần trung tâm trong thiết kế dịch vụ

  • Những người quan tâm đến việc tái cấu trúc schema (schema refactoring) và cấu trúc DB tiến hóa (DDL Evolution)

🤭 Hồ sơ của nhà phát triển tại Thung lũng Silicon, người đã cùng chuẩn bị bài giảng này

Tôi là Waddy, một nhà phát triển máy chủ backend với 13 năm kinh nghiệm. Sau khi làm việc tại nhiều doanh nghiệp khác nhau ở Hàn Quốc, gần đây tôi đã chuyển sang Thung lũng Silicon và hiện đang phát triển các dự án liên quan đến AI.

Tôi bén duyên và gia nhập đội ngũ thông qua một người bạn là nhà phát triển tại Toss. Tôi cảm thấy rất thú vị khi có thể cung cấp nhiều thông tin đa dạng trong môi trường internet. Tôi sẽ cố gắng hết sức để truyền đạt những kiến thức mình biết một cách dễ hiểu và thoải mái nhất có thể.

[Cựu] Nhân viên phát triển máy chủ tại startup AI ở Thung lũng Silicon

[Cựu] Nhà phát triển máy chủ tại trụ sở Kakao

[Trước đây] Từng làm việc với tư cách là nhà phát triển máy chủ tại 2~3 startup trong nước

[Cựu] Chuyên ngành Khoa học máy tính tại nước ngoài

Lưu ý

Môi trường thực hành

  • Được thực hiện trong môi trường Apple M3 Air.

  • Sử dụng Docker để tối ưu hóa tài nguyên và thiết lập môi trường khép kín.


Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Nhà phát triển backend mới bắt đầu học PostgreSQL nhưng muốn hiểu rõ một cách bài bản và tập trung vào thực tế công việc.

  • Nhà phát triển muốn học hỏi chuyên sâu hơn mức CRUD, bao gồm cả chỉ mục (index), giao dịch (transaction) và cấu trúc JOIN.

  • Những nhà phát triển muốn xử lý JSON, dữ liệu vector và các tính năng mở rộng bằng PostgreSQL trong kỷ nguyên AI

  • Các nhà phát triển trình độ sơ cấp và trung cấp thường xuyên gặp phải các vấn đề về hiệu suất cơ sở dữ liệu và tối ưu hóa truy vấn.

  • Sinh viên đang chuẩn bị xin việc và nhà phát triển đang làm việc muốn tăng cường năng lực thiết kế cơ sở dữ liệu và vận dụng SQL trong phỏng vấn hoặc thực tế công việc.

  • Dành cho những ai tò mò về hệ sinh thái Plugin đa dạng của PostgreSQL

Xin chào
Đây là Hong

8,401

Học viên

547

Đánh giá

152

Trả lời

4.7

Xếp hạng

28

Các khóa học

Giới thiệu bản thân

Tôi bắt đầu học lập trình sau một thời gian dài lười biếng ở nhà và cảm thấy hứng thú với nó, hiện tại tôi đang đảm nhận việc phát triển máy chủ nền tảng (platform server) tại Pangyo. Tôi tiếp tục hoạt động với tư cách là người chia sẻ kiến thức vì muốn cung cấp cho các bạn phương pháp tôi đã học cũng như những vấn đề và giải pháp thực tế mà các bạn có thể gặp phải trong công việc.

 

Bài giảng không chỉ được tạo ra từ kiến thức của riêng tôi. Mọi bài giảng đều có sự đồng hành của tất cả các bạn.

 

Kinh nghiệm của người chia sẻ kiến thức

[Trước đây] Nhà phát triển Blockchain liên quan đến Sandbox IP

[Cựu] Nhà phát triển Backend Metaverse

[Hiện tại] Nhà phát triển server đang làm việc lâu năm tại Pangyo

 

Lịch sử phỏng vấn

Các câu hỏi khác

  • unduck2022@gmail.com

Thêm

Chương trình giảng dạy

Tất cả

38 bài giảng ∙ (9giờ 26phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

2 đánh giá

5.0

2 đánh giá

  • gjsu540607534님의 프로필 이미지
    gjsu540607534

    Đánh giá 11

    Đánh giá trung bình 5.0

    5

    95% đã tham gia

    Đây là người chia sẻ kiến thức duy nhất trên Inflearn mà tôi luôn bật thông báo và theo dõi sát sao... Thầy luôn giảng giải lý thuyết thông qua nhiều hình ảnh minh họa đa dạng, và đúng như phần giới thiệu, 90% khóa học là thực hành. Chính vì vậy mà tôi thấy nó càng hữu ích và thú vị hơn. Thay vì những bài giảng rập khuôn, thầy luôn dạy một cách thực tế nên rất hợp với phong cách của tôi. (Dù thỉnh thoảng thầy có mắc lỗi ㅋㅋㅋ nhưng thầy cũng thừa nhận một cách rất ngầu). Tôi cũng đang tham gia cộng đồng, thầy luôn chia sẻ những thông tin hữu ích và trả lời mọi thắc mắc một cách rất thân thiện, thực sự tôi đã học hỏi được rất nhiều. Luôn cảm ơn thầy rất nhiều. Tôi cũng hay viết đánh giá khóa học nhưng đây là lần đầu tiên tôi viết dài như thế này!!

    • warna97725274님의 프로필 이미지
      warna97725274

      Đánh giá 9

      Đánh giá trung bình 5.0

      5

      92% đã tham gia

      Tôi nghĩ đây thực sự là một bài giảng ở đẳng cấp rất hiếm thấy.. Tôi mới chỉ từng sử dụng MySQL thôi, nhưng qua đây tôi đã hiểu rõ hơn về sức hấp dẫn của PostgreSQL. Cảm ơn bạn vì nội dung tuyệt vời này.

      Khóa học khác của Hong

      Hãy khám phá các khóa học khác của giảng viên!

      Khóa học tương tự

      Khám phá các khóa học khác trong cùng lĩnh vực!

      Ưu đãi có thời hạn

      1.282.528 ₫

      59%

      3.191.406 ₫