[Phiên bản sửa đổi 2026] Kỹ sư phân tích dữ liệu lớn - Thực hành (với Python)
Kỳ thi Chứng chỉ Phân tích Dữ liệu lớn là chứng chỉ quốc gia được tổ chức mỗi năm 2 lần. Để hỗ trợ những người đang chuẩn bị cho kỳ thi thực hành, tôi đã giảng dạy chi tiết từ những kiến thức cơ bản đến các nội dung cốt lõi. Độ khó của kỳ thi ngày càng tăng qua từng đợt. Vì vậy, tôi đã cung cấp nhiều nội dung quan trọng từ cơ bản để giúp các bạn nâng cao tỷ lệ đậu.
Dù mất nhiều thời gian,
vì là ngôn ngữ mới nên tôi đang học từ đầu.
Tôi kỳ vọng nếu chăm chỉ học tập sẽ có kết quả tốt.
5.0
jejumoon
30% đã tham gia
Chậm nhưng mình vẫn xem tốt ^^
Bạn sẽ nhận được điều này sau khi học.
Kỳ thi thực hành Kỹ sư phân tích dữ liệu lớn - Hình thức tự luận (viết)
Kỳ thi thực hành Phân tích dữ liệu lớn (Big Data Analysis Certification) - Dạng bài tập thực hành
Học máy
Phân tích dữ liệu bằng Python (Pandas)
Kỳ thi thực hành Kỹ sư phân tích dữ liệu lớn được quốc gia công nhận, năm nay nhất định hãy thi đỗ nhé!
Chuyên gia phân tích dữ liệu Hãy thử sức với chứng chỉ kỹ thuật quốc gia! 🏆
Kỹ sư phân tích dữ liệu lớn?
Dựa trên sự hiểu biết về dữ liệu lớn, đây là chứng chỉ nhằm kiểm chứng năng lực thực tế của người làm chuyên môn trong việc lập kế hoạch phân tích dữ liệu lớn, thu thập, lưu trữ, xử lý, phân tích và trực quan hóa dữ liệu lớn.
Nhu cầu về chuyên gia phân tích dữ liệu lớn đang ngày càng tăng cao nhằm đảm bảo năng lực cạnh tranh của quốc gia và doanh nghiệp. Tuy nhiên, do tình trạng thiếu hụt nguồn cung so với nhu cầu nên việc đảm bảo nhân lực đang gặp nhiều khó khăn. Vì vậy, ở cấp độ chính phủ, chứng chỉ Kỹ sư phân tích dữ liệu lớn quốc gia - một loại chứng chỉ kỹ thuật quốc gia có thể kiểm chứng năng lực một cách hệ thống cùng với việc đào tạo các chuyên gia phân tích dữ liệu lớn - đã được ra đời.
Trong năm 2025, các kỳ thi định kỳ lần thứ 10~11 sẽ được tổ chức, và vì độ khó của kỳ thi đang ngày càng tăng cao qua từng đợt nên cần có sự học tập chuyên sâu. Khóa học này đã hệ thống lại nội dung cốt lõi từ cơ bản của tổng cộng 3 môn học: Python & Pandas, Xử lý dữ liệu và Học máy (Machine Learning).
Chỉ tập trung vào những nội dung thiết yếu để vượt qua kỳ thi!! 👌
Khóa học này là quá trình học về ngôn ngữ lập trình Python và các thư viện Pandas, Scikit-Learn, statsmodels, scipy, giúp bạn chuẩn bị cho Phần thực hành 1, 2, 3 của kỳ thi Kỹ sư Phân tích Dữ liệu lớn. Vì đây là kỳ thi thực hành không thể giải quyết chỉ bằng cách học thuộc lòng đơn thuần, nên khóa học sẽ tập trung vào các giải thích dựa trên ví dụ thực tế để giúp bạn có thể ứng dụng đa dạng.
Pandas (판다스)
Bạn có thể vừa làm theo vừa học hỏi quá trình từ việc tải 4 tệp tin lên, thông qua tiền xử lý cho đến bước phân tích.
Nội dung được cấu trúc để giải thích lặp đi lặp lại tùy theo độ khó, giúp bạn có thể tiếp thu một cách tự nhiên.
Nội dung này đề cập đến các kỹ thuật tiền xử lý dữ liệu đa dạng cần thiết cho học máy.
Scikit-Learn(사이킷런), statsmodels
Sử dụng trực tiếp các dữ liệu học tập đơn giản và thực hiện mô hình hóa cơ bản để hiểu các khái niệm về học máy.
Chúng tôi sẽ thực hiện các ví dụ lập mô hình bằng cách sử dụng các câu hỏi đã từng xuất hiện trong kỳ thi Kỹ sư Phân tích Dữ liệu lớn và dữ liệu lấy từ Kaggle.
✅ Loại bài tập 2, 3 sẽ học phương pháp ghi nhớ và quy trình thực hiện để bạn có thể chỉ chuẩn bị những dạng đề sẽ xuất hiện trong kỳ thi.
✅ Bạn chỉ cần luyện tập thông qua việc giải các đề thi đã xuất hiện để có thể đạt được điểm số cao.
📖 Hướng dẫn kỳ thi Kỹ sư Phân tích Dữ liệu lớn
Bài thi tích hợp (tự luận và thực hành) trong 180 phút
Thực hành phân tích dữ liệu lớn: Thu thập dữ liệu, Tiền xử lý dữ liệu, Xây dựng/Đánh giá mô hình dữ liệu
Đạt từ 60 điểm trở lên trên thang điểm 100 là đậu
Ngày đăng ký hồ sơ/Ngày thi năm 2025: Kỳ thứ 10 (19.5~23.5/21.6 (Thứ Bảy)), Kỳ thứ 11 (27.10~31.10/29.11 (Thứ Bảy))
* Để chuẩn bị cho kỳ thi lần thứ 10, chúng tôi dự kiến sẽ tổ chức Quiz hàng ngày bắt đầu từ ngày 16 tháng 4. * Vận hành nhóm chat mở Q&A để giúp giải quyết các khó khăn trong quá trình thực hành.
Nội dung học tập 📚
BƯỚC 1. Tìm hiểu về Python
Đây là khóa học tập trung vào việc tiếp thu kỹ năng sử dụng ngôn ngữ Python bằng cách chỉ học những nội dung quan trọng ở mức độ chuẩn bị cho kỳ thi, dành cho những người mới bắt đầu chưa quen với Python.
BƯỚC 2. Pandas và xử lý dữ liệu
Tìm hiểu các nội dung cơ bản của Pandas, một thư viện Python dùng để xử lý dữ liệu. Đối với bài thi thực hành Loại 1, bạn sẽ hiểu các dạng xử lý dữ liệu có thể xuất hiện từ nhiều góc độ khác nhau, đồng thời nắm vững phương pháp xử lý dữ liệu thông qua việc trực tiếp thực hành giải quyết các bài toán.
BƯỚC 3. Học máy
Để chuẩn bị cho kỳ thi thực hành Loại 2, chúng ta sẽ học về cấu trúc tổng thể và các kỹ thuật của học máy (machine learning) bằng cách sử dụng sklearn. Tìm hiểu cách xây dựng và đánh giá các mô hình hồi quy và phân loại trong học máy, đồng thời trực tiếp giải các câu hỏi đã từng xuất hiện trong kỳ thi và các câu hỏi có khả năng ra đề cao.
STEP 4. Kiểm định thống kê
Để chuẩn bị cho kỳ thi thực hành Loại 3, chúng ta sẽ tìm hiểu về cách giải thích mô hình tuyến tính và kiểm định tham số/phi tham số bằng cách sử dụng statsmodels và scipy.
BƯỚC 5. Giải đề thi đã qua
Giải quyết các đề thi đã xuất hiện từ lần thứ 2 đến lần thứ 9 để có thể chuẩn bị cho kỳ thi thực tế. Đề thi lần thứ 9 dự kiến sẽ được đăng tải vào ngày 7 tháng 4.
Hỏi & Đáp 💬
Q. Sau khi đậu kỳ thi lý thuyết, tôi có thể dự thi kỳ thi thực hành tối đa bao nhiêu lần?
Sau khi đậu kỳ thi lý thuyết, bạn có cơ hội dự thi thực hành trong vòng 2 năm. Vì mỗi năm có 2 kỳ thi nên tổng cộng sẽ có 4 cơ hội dự thi. Lưu ý rằng đây là chứng chỉ kỹ thuật quốc gia và có yêu cầu về điều kiện dự thi, vì vậy bạn cần kiểm tra xem mình có đủ điều kiện hay không.
Q. Tôi nên dự tính thời gian học trong bao lâu?
Thời gian học tập có lẽ sẽ có sự khác biệt lớn tùy theo từng cá nhân. Và nếu bạn bắt đầu học khi chưa có khái niệm về lập trình thì sẽ mất nhiều thời gian hơn. Bạn nên dành khoảng 2-3 tháng, tạo thói quen nhập mã code và giải thích mã hàng ngày. Đặc biệt, vì nội dung về Pandas và ML được chuẩn bị ở mức độ có thể ứng dụng được nên bạn có thể cảm thấy nội dung hơi nhiều. Sẽ rất tốt nếu bạn vừa đặt câu hỏi vừa học hỏi, và ngay trước kỳ thi, việc học thuộc lòng các mã code thực hành cũng là điều cần thiết.
Giới thiệu người chia sẻ kiến thức ✒️
Yoon So-young (Đại diện EduAtoZ)
Giảng viên Yoon So-young là chuyên gia đào tạo IT với 24 năm kinh nghiệm giảng dạy phần mềm.
Lịch sử giảng dạy
Giảng dạy SW cho nhân viên mới và nhân viên đang làm việc tại Samsung, LG
Học viện Xử lý Thông tin Trung ương
Trường Trung học Thương mại Nữ sinh Incheon (Kiêm nhiệm công nghiệp - học thuật)
Phòng Thương mại và Công nghiệp Hàn Quốc
Đại học Gimcheon, Đại học Sungkyunkwan (Suwon), Đại học Soongsil, Đại học Quốc gia Seoul, v.v.
Nhiều nơi khác ngoài Multi Campus
Bằng cấp/Chứng chỉ sở hữu
Kỹ sư xử lý thông tin cấp 1
Giấy phép Giáo viên đào tạo nghề (Xử lý thông tin bậc 2)
Dữ liệu phân tích bán chuyên nghiệp (ADsP), Dữ liệu phân tích chuyên nghiệp (ADP)
Kỹ sư phân tích dữ liệu lớn
Các khóa học giảng dạy chính
[Chứng chỉ] Kỹ sư xử lý thông tin, Kỹ thuật viên xử lý thông tin, Chuyên gia phân tích dữ liệu bán chuyên nghiệp (ADSP), Kỹ sư phân tích dữ liệu lớn
[Thuật toán] Cấu trúc dữ liệu (Sơ cấp, Trung cấp), Thuật toán (Nhân viên hiện tại và nhân viên mới của Samsung, nhân viên hiện tại của LG)
[Lập trình] Ngôn ngữ C, JAVA, HTML/CSS/Java Script, Ứng dụng Android, Python (Cơ bản, Xử lý dữ liệu, Phân tích dữ liệu)
[AI] Machine Learning (Học có giám sát, không giám sát), Deep Learning (Cơ bản về tensorflow, CNN, RNN)
[Hướng dẫn mua giáo trình]
Các cơ quan hoặc doanh nghiệp cần phái cử giảng viên cho lớp chuyên đề thực hành Big Data Analysis Certification (trực tiếp & trực tuyến) vui lòng liên hệ.
Nội dung bài giảng được cung cấp dưới dạng PDF. Những ai muốn mua giáo trình đóng tập vui lòng liên hệ qua imbgirl@naver.com!
Khuyến nghị cho những người này
Khóa học này dành cho ai?
Những người muốn đăng ký dự thi kỳ thi cấp chứng chỉ Kỹ sư phân tích dữ liệu lớn (Big Data Analysis Engineer)
Những người muốn học thư viện phân tích dữ liệu Pandas của Python
Những người quan tâm đến phân tích dữ liệu lớn (Big Data)
Cần biết trước khi bắt đầu?
Người thi đỗ kỳ thi viết Kỹ sư Phân tích Dữ liệu lớn
Chào bạn! ^^
Cảm ơn bạn đã đánh giá tốt!
Bạn đang chuẩn bị cho kỳ thi 20/6 phải không? Từ 5/5 sẽ diễn ra đợt 2 quiz hàng ngày để luyện thi đỗ. Bạn cần học đến Pandas rồi nhé.
Nếu quan tâm, hãy đăng ký nhé! (Tham gia phòng chat mở để nhận thông báo nhé.)
Đăng ký cuộc thi đố vui hàng ngày 빅분기 Thực hành: https://forms.gle/oqQ9UZh6T3XoHwMQA
Chúc bạn một ngày tốt lành!
Chúc mừng bạn đã đậu~^^
Kỳ thi trước khó nên tôi đã chuẩn bị những câu hỏi khó làm quiz, mong rằng việc học tập khó khăn như vậy cũng sẽ giúp ích cho bạn trong việc sử dụng thực tế^^
Còn 30 ngày nữa là thi ^^
Bạn đã tham gia phòng KakaoTalk mở chưa? Chúng tôi sẽ làm việc cùng nhau cho đến khi có sự chuẩn bị cuối cùng cho nội dung dự kiến tải lên vào đầu tháng 6! (Tôi muốn thêm lời giải cho các câu hỏi thi trước.)