inflearn logo
inflearn logo

Dữ liệu hình ảnh học bằng Excel và Python

[Tóm tắt bài giảng: Từ Pixel đến Thực tiễn, Xây dựng Hệ thống Nhận diện Danh thiếp] * **Tiền xử lý (Pre-processing):** Học cách loại bỏ nhiễu và sử dụng Gaussian Blur cùng Canny Edge để trích xuất "khung xương" của danh thiếp. * **Biến đổi Hough (Hough Transform):** Trải qua quá trình "vòng loại" để chọn ra những "đường viền" thực sự từ hàng vạn điểm thông qua hệ thống bình chọn $(\rho, \theta)$. * **Suy luận hình học:** Giải các phương trình đường thẳng phức tạp bằng phương pháp thế và ma trận để xác định chính xác bốn đỉnh $(x, y)$ của danh thiếp. * **Sắp xếp và lọc dữ liệu:** Học kỹ thuật tinh chế dữ liệu bằng cách loại bỏ các đường trùng lặp và gắn nhãn cho các điểm tìm được theo thứ tự 'trên-trái, trên-phải, dưới-phải, dưới-trái'. * **Biến đổi ma thuật (Perspective):** Kết thúc ấn tượng với kỹ thuật thực tiễn giúp làm thẳng những hình ảnh bị nghiêng, hoặc ngược lại, ghép hình ảnh vào một khung hình mong muốn. 📢 "Bạn có thấy nhức đầu khi nhìn vào các công thức toán học không? Tôi cũng từng như vậy." Khi lần đầu đảm nhận dự án xử lý hình ảnh trong thực tế, điều khiến tôi khổ sở nhất chính là những công thức $\sin, \cos$ tràn ngập màn hình. Sách vở thì đầy rẫy công thức, nhưng lại chẳng có nơi nào trả lời cho câu hỏi thực tế: **"Tại sao mã nguồn của tôi lại không tìm thấy danh thiếp?"** Thông qua bài giảng này, tôi muốn giúp các bạn giải quyết ba vấn đề nan giải thường gặp: 1. **"Vấn đề toán học cảm thấy như ngôn ngữ ngoài hành tinh"** → Giải quyết bằng [Sức mạnh của sự ẩn dụ]. Thay vì chỉ học thuộc lòng phương trình đường thẳng, tôi sẽ giúp bạn hiểu thông qua hình ảnh **'tia laser bắn ra từ gốc tọa độ'** và **'trò chơi đổ bóng'**. Khi đã hiểu nguyên lý, mã nguồn sẽ tự khắc tuân theo. Tôi sẽ dịch các công thức sang 'ngôn ngữ dễ hiểu nhất' mà tôi đã đúc kết được sau vô số lần thử sai. 2. **"Vấn đề hiểu lý thuyết nhưng không ứng dụng được"** → Giải quyết bằng [Vòng loại dữ liệu]. Tại sao danh thiếp của tôi lại có tới 10 đường viền, tại sao thứ tự các đỉnh lại bị xáo trộn... Tôi sẽ công khai toàn bộ bí quyết debug để lọc và sắp xếp những 'dữ liệu rác' mà bạn chắc chắn sẽ gặp phải trong thực tế. Logic chọn lọc tinh hoa này sẽ nâng tầm dự án của bạn lên một đẳng cấp mới. 3. **"Vấn đề kết quả đầu ra nhàm chán"** → Kết thúc bằng [Ghép hình tương tác]. Đây không phải là bài giảng chỉ dừng lại ở việc nhìn những đường viền đen trắng. Khoảnh khắc bạn đưa tấm danh thiếp mình tạo ra vào đúng 'khung hình danh vọng' mà bạn tự tay nhấp chuột chọn, bạn sẽ trải nghiệm được **'phép màu điều khiển không gian'** chứ không đơn thuần là lập trình. "Computer Vision không phải là toán học, mà là quá trình sở hữu một đôi mắt mới để nhìn ngắm thế giới." Tôi muốn truyền tải đến các bạn khoảnh khắc 'A-ha!' đầy phấn khích mà tôi đã nhận ra trong quá trình làm việc thực tế. Giờ đây, bạn có thể gấp những cuốn sách lý thuyết phức tạp lại. Hãy cùng tôi dùng 'cây bút' mã nguồn để tự do vẽ nên những hình ảnh theo ý muốn!

15 học viên đang tham gia khóa học này

Độ khó Cơ bản

Thời gian Không giới hạn

Python
Python
Excel
Excel
Python
Python
Excel
Excel

Bạn sẽ nhận được điều này sau khi học.

  • Tự tin triển khai các nguyên lý toán học bằng mã code

  • Bí quyết xử lý dữ liệu thực tế hỗn loạn

  • Tư duy hình học uốn nắn không gian một cách tự do

  • Pipeline xử lý hình ảnh hoàn chỉnh của riêng tôi




[Chi tiết khóa học] Biến danh thiếp bị lệch thành bản quét! Làm chủ xử lý hình ảnh OpenCV

1. Tổng quan khóa học: "Tại sao mã nguồn của tôi không hoạt động trong thực tế?"

Bạn đã bao giờ trải qua việc mã nguồn chạy rất tốt trong bài hướng dẫn nhưng lại hoàn toàn vô dụng khi áp dụng vào ảnh danh thiếp do chính mình chụp chưa?

Cốt lõi của nhận dạng hình ảnh không chỉ đơn thuần là gọi các hàm, mà nằm ở tư duy toán học để tinh chỉnh dữ liệu thực tế lộn xộn. Khóa học này sẽ bao gồm từ A đến Z về lập trình thị giác máy tính, từ tiền xử lý đến biến đổi hình học và tổng hợp hình ảnh thông qua một dự án thực tế là nhận dạng danh thiếp.


2. Chương trình học chi tiết: 5 bước ma thuật

BƯỚC 1. Trích xuất khung xương: Tìm kiếm sự thật trong nhiễu

  • Công nghệ cốt lõi: Gaussian Blur, Canny Edge

  • Nội dung: Bạn sẽ học các kỹ thuật tiền xử lý để loại bỏ hiện tượng lóa sáng và nhiễu, chỉ để lại các 'cạnh' (edge) sắc nét vốn là các ứng cử viên cho khung viền của danh thiếp.

BƯỚC 2. Tuyển chọn dữ liệu: Hợp nhất hàng vạn điểm thành các đường thẳng

  • Công nghệ cốt lõi: Biến đổi Hough (Hough Transform, không gian $\rho, \theta$)

  • Nội dung: Tổng hợp các phiếu bầu từ những điểm phân tán để lựa chọn ra các ứng cử viên đường viền mạnh mẽ. Truyền đạt logic thực tế để sắp xếp các đường bị trùng lặp thông qua phép ẩn dụ "Những kẻ giống nhau là cùng một đội!" và lọc ra 4 đường cốt lõi hàng đầu.

BƯỚC 3. Đòn đánh hình học: Tính toán các đỉnh không nhìn thấy

  • Công nghệ cốt lõi: Phương pháp thế trong hệ phương trình và phép toán ma trận

  • Nội dung: Tính toán về mặt toán học các 'giao lộ (giao điểm)' nơi các đường thẳng gặp nhau. Ngay cả khi hình ảnh bị cắt, chúng ta vẫn thực hiện phép thuật để tìm ra chính xác các đỉnh $(x, y)$ thông qua đường kéo dài của các đường thẳng.

BƯỚC 4. Gắn nhãn: Sắp xếp Trên cùng bên trái/Trên cùng bên phải/Dưới cùng bên phải/Dưới cùng bên trái

  • Công nghệ cốt lõi: Thuật toán chuẩn hóa và sắp xếp tọa độ

  • Nội dung: Gán thứ tự cho 4 điểm để máy tính có thể hiểu được. Xây dựng một logic vững chắc để tìm ra 'góc trên bên trái' từ mọi góc độ bằng cách sử dụng các phép toán $x+y$$x-y$.

BƯỚC 5. Phép màu không gian: Biến đổi phối cảnh (Perspective) và Tổng hợp

  • Công nghệ cốt lõi: getPerspectiveTransform, warpPerspective

  • Nội dung: Trải phẳng một hình tứ giác bị nghiêng thành một tờ giấy hình chữ nhật một cách hoàn hảo. Hơn thế nữa, bạn sẽ hoàn thành dự án bằng cách tự tay nhấp chuột để ghép danh thiếp của mình vào khung hình 'Khung ảnh người chiến thắng' một cách tự nhiên.


3. Điểm đặc biệt chỉ có ở bài giảng này (Kinh nghiệm của giảng viên)

"Máy tính sẽ tính toán các công thức. Các bạn chỉ cần hiểu luồng vận hành là được."

  • Điều trị nỗi sợ toán học: Bạn không cần phải học thuộc các công thức $\sin, \cos$. Tôi sẽ giúp bạn hình dung nguyên lý trong đầu trước bằng những ví dụ so sánh trực quan như 'tia laser' và 'bóng đổ'.

  • Gỡ lỗi thực chiến: "Tại sao không thấy đường thẳng?", "Tại sao giao điểm lại nằm sai chỗ?" Tôi đã lồng ghép vào khắp mã nguồn những giải pháp cho các tình huống ngoại lệ thường gặp nhất trong công việc thực tế.

  • Thực hành tương tác: Không chỉ dừng lại ở việc xem kết quả, khóa học hướng tới 'lập trình sống động', nơi bạn trực tiếp nhấp chuột vào màn hình để lấy tọa độ và trải nghiệm quá trình tổng hợp.


4. Thay đổi sau khóa học: 'Đôi mắt' của bạn sẽ trở nên khác biệt

  1. Khả năng thiết kế: Có thể thiết kế các dự án thị giác máy tính phức tạp thành các quy trình (pipeline) từng bước một.

  2. Tự tin triển khai: Bạn sẽ sở hữu khả năng hiện thực hóa, chuyển đổi logic toán học sang mã Python một cách tức thì.

  3. Khả năng mở rộng ứng dụng: Hoàn thiện nền tảng thể lực cơ bản để tiến tới các công nghệ thị giác máy tính cấp cao như nhận diện làn đường, tiền xử lý OCR, nhận diện dấu vết AR (AR marker), v.v., vượt xa cả việc nhận diện danh thiếp.


5. Hướng dẫn khóa học

  • Chuẩn bị: Hiểu biết về cú pháp Python cơ bản, và sự tò mò muốn quét sạch mọi tấm danh thiếp đến cùng!

  • Đối tượng đề xuất: Lập trình viên sợ toán, người mới bắt đầu đang lạc lối giữa lý thuyết và thực hành, và bất kỳ ai muốn nếm trải tinh hoa của công nghệ thị giác máy tính.

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Lập trình viên mới vào nghề từng là người bỏ cuộc với môn toán

  • Người thoát khỏi "mê cung hướng dẫn", nắm vững lý thuyết nhưng không biết ứng dụng.

  • Người mới bắt đầu học về thị giác máy tính muốn tiến lên bước tiếp theo

Cần biết trước khi bắt đầu?

  • Cơ bản về Python

  • Toán học cấp trung học cơ sở

Xin chào
Đây là hjk1000

1,615

Học viên

45

Đánh giá

10

Trả lời

4.7

Xếp hạng

12

Các khóa học

Xin chào

Tôi là một nhân viên văn phòng không chuyên đang nỗ lực học tập về Deep Learning.

Tôi muốn chia sẻ với các bạn những điều mình đã cảm nhận được trong quá trình học tập.

Cảm ơn bạn.

Thêm

Chương trình giảng dạy

Tất cả

14 bài giảng ∙ (4giờ 57phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Chưa có đủ đánh giá.
Hãy trở thành tác giả của một đánh giá giúp mọi người!

Khóa học khác của hjk1000

Hãy khám phá các khóa học khác của giảng viên!

Khóa học tương tự

Khám phá các khóa học khác trong cùng lĩnh vực!

Ưu đãi có thời hạn, kết thúc sau 6 ngày ngày

1.650 ₫

70%

118.738 ₫