Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
Data Science

/

Data Engineering

빅데이터 클러스터 xây dựng gói; lộ trình hướng tới thành công

Đây là khóa học tập trung vào codelab, trong đó bạn sẽ tự xây dựng hệ thống dữ liệu lớn hoặc cụm hệ thống xử lý phân tán có khả năng bảo đảm độ khả dụng cao (HDFS, Zookeeper, Spark, Zeppelin).

(4.7) 19 đánh giá

112 học viên

  • jphil
cluster
클러스터
빅데이터
실습 중심
Big Data
Apache Spark
Hadoop
Data Engineering

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Cài đặt Big Data Cluster

  • Hệ thống xử lý tệp phân tán

  • Khả năng cao

  • Hadoop

  • HDFS

  • Tia lửa Apache

  • Zeppelin của Apache

  • Người trông coi sở thú Apache

  • AWS (EC2, AMI, Nhóm bảo mật)

Xây dựng cụm phân tán dữ liệu lớn thông qua phòng thí nghiệm mã.
Gói xây dựng cụm dữ liệu lớn
👨🏻‍🎓

Xin chào, tôi là J.PHIL 🍏

Khi một học kỳ đã trôi qua và một cơ hội tốt đã đến, mùa này chúng tôi sẽ tổ chức một bài giảng có tiêu đề ' Gói xây dựng cụm dữ liệu lớn ', nơi bạn sẽ tự mình xây dựng một cụm dữ liệu phân tán lớn 📚

Nhờ sự hỗ trợ của bạn, lấy cảm hứng từ lớp học "Big Data Pipeline Master" trước đó, tôi đã tự hỏi: "Liệu có khóa học nào vừa thử thách vừa có ý nghĩa hơn không?" Sau nhiều lần cân nhắc, tôi đã dày công xây dựng khóa học này.

Từ khóa: Cụm dữ liệu lớn, Hệ thống phân tán, Tính khả dụng cao, Hadoop, HDFS, Apache Spark, Zookeeper, Zeppelin, AWS EC2 & AMI

Tại sao chúng ta nên tham dự các bài giảng 🙇🏻

Trong thập kỷ qua, những tiến bộ nhanh chóng về công nghệ đã dẫn đến sự phát triển của các nền tảng và dịch vụ, cho phép chúng ta sử dụng và phân tích lượng lớn dữ liệu được tạo ra từ cuộc sống hàng ngày, giúp chúng ta có được chất lượng cuộc sống cao hơn.

Như thể hiện trong Hình 1 bên dưới, không chỉ các tập đoàn lớn trong nước mà cả các tập đoàn toàn cầu cũng công khai nhấn mạnh tầm quan trọng của Lưu trữ dữ liệu lớn và Xử lý dữ liệu lớn, đồng thời yêu cầu nhiều kỹ sư có kỹ năng phân tích và xây dựng tương tự.

001.png

002.png

Tuy nhiên, trước khi bước vào ngành , việc tích lũy kinh nghiệm thực tế trong việc xây dựng hoặc quản lý một CỤM DỮ LIỆU LỚN là rất khó khăn . Do đó, khi có cơ hội tạo ra giá trị có ý nghĩa, việc thiếu kinh nghiệm có thể dẫn đến những kết quả đáng thất vọng.

Khi còn là một nhà nghiên cứu, tôi đã phải tự mình xây dựng một cụm dữ liệu lớn gồm 50 người trong khi viết bài báo cho 'HỘI NGHỊ HÀNG ĐẦU DỮ LIỆU'. Tôi đã phải chịu đựng gánh nặng phải làm gương cho các thành viên và áp lực lớn khi phải trả tiền, và tôi đã thức trắng đêm suốt hai tuần , chỉ tập trung vào việc xây dựng cụm dữ liệu.

Tất nhiên, tôi đã học được rất nhiều từ trải nghiệm quý báu đó, và nó đã trở thành hành trang quý báu cho tương lai của tôi. Tuy nhiên , tôi không muốn bạn lãng phí thời gian một cách vô ích như vậy. Nói cách khác, tôi tạo ra khóa học này với hy vọng rằng bạn sẽ không chỉ dành 200 giờ quý báu của mình để xây dựng một cụm, mà thay vào đó, hãy dành thời gian đó để thực hiện các thí nghiệm hoặc phân tích dữ liệu khách hàng một cách hiệu quả . 📝

Trên hết, tôi hy vọng rằng sau khi bạn tham gia bài giảng hiện tại và tích lũy kinh nghiệm xây dựng cụm, nó sẽ giúp ích rất nhiều cho bạn khi xây dựng một cụm dữ liệu lớn ngoài thực tế hoặc trong quá trình học sau đại học như tôi. Hãy tham khảo bài giảng vì nó không giới hạn.💓

Chúng ta sẽ học được 📚

📝

Kinh nghiệm viết bài báo cho hội nghị dữ liệu hàng đầu

👨🏻‍💼

Kinh nghiệm quý báu trong việc xây dựng và phân tích các hệ thống dữ liệu lớn có được từ thực tế

🧑🏻‍🏫

Kinh nghiệm lâu năm trong việc bồi dưỡng sinh viên giỏi tại trường đại học

Với kinh nghiệm quý báu này, chúng tôi hy vọng có thể giúp bạn tạo ra một vũ khí mạnh mẽ ⚔️ trong lĩnh vực của mình.

1. Trên HDFS , một hệ thống tệp phân tán đảm bảo tính khả dụng cao (xem ví dụ Daemon bên dưới)

2. Kiệt tác hệ thống dữ liệu lớn: Apache Spark Zeppelin , một máy tính xách tay chuyên dụng cho dữ liệu lớn

Chúng tôi sẽ tự xây dựng gói cụm thông qua lý thuyết và phòng thí nghiệm mã vững chắc.

image.png

Bạn có thấy các cấu hình daemon hệ thống tệp có tính khả dụng cao ở trên có vẻ hơi phức tạp không? Lần đầu tiên nhìn thấy sơ đồ kiến trúc và cấu hình hệ thống có thể khiến bạn choáng ngợp.

Nhưng

Dựa trên phản hồi quý báu từ những học viên xuất sắc trong sáu năm qua và kinh nghiệm triển khai hai khóa học Inflearn gần đây, chúng tôi đã sắp xếp nội dung thành những nội dung dễ hiểu, chất lượng cao, được thiết kế theo từng bước, phù hợp với trình độ của học viên . Mời bạn theo dõi.

lời cảm ơn đặc biệt tới các học sinh đáng yêu của tôi 👨🏻‍🎓

Xin hãy cho tôi biết về chương trình giảng dạy 🧑🏻‍🏫

Thay vì bắt đầu trực tiếp với CODELAB, chúng ta sẽ bắt đầu bằng việc tìm hiểu lý thuyết xây dựng một cụm máy chủ có tính sẵn sàng cao . Đối với những học viên chưa quen với môi trường AWS hoặc Linux, chúng ta sẽ xem các video hướng dẫn và tìm hiểu kiến thức nền tảng trước khi chuyển sang các bài thực hành lập trình chuyên sâu .

curri-1.jpg

Bất kỳ ai quan tâm đến dữ liệu lớn hoặc xử lý phân tán đều có thể tham gia khóa học này 🧑🏻‍🎓

Môi trường đào tạo như thế nào?

Bạn có thể theo học lớp học một cách thoải mái bằng cách chuẩn bị một môi trường học tập thoải mái như minh họa bên dưới.

  • Hệ điều hành: Ubuntu 20.04 LTS

  • Biên tập viên: Vim (tùy theo sở thích của bạn)

  • Thông số kỹ thuật máy

    • AWS EC2 / c5.large ( 2 lõi 4GB ) 4 hoặc 5 đơn vị

Vui lòng xem Chương trình giảng dạy của khóa học để biết thêm chi tiết 😊

Giới thiệu J.PHIL 👨‍👨‍👧‍👦

image.png

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Sinh viên muốn trải nghiệm trực tiếp việc xây dựng cụm hệ thống xử lý dữ liệu lớn

  • Sinh viên quan tâm và tìm kiếm sự nghiệp trong phân tích dữ liệu và hệ thống

  • Các nhà phát triển muốn có được kinh nghiệm thực tế với các cụm có tính khả dụng cao

  • Người tìm việc muốn phát huy thế mạnh trong phân tích và xây dựng dữ liệu lớn

Cần biết trước khi bắt đầu?

  • Lập trình cơ bản bằng Python

  • Kiến thức cơ bản về lệnh Linux

  • Kiến thức cơ bản về cơ sở dữ liệu

Xin chào
Đây là

448

Học viên

39

Đánh giá

50

Trả lời

4.9

Xếp hạng

2

Các khóa học

안녕하세요 J.PHIL 입니다 🧑🏻‍🎓

첫번째 강의로 [ 빅데이터 시스템 구축 및 분석에 관심있는 입문자 ] 를 위해
"Mastering Big Data Processing: Tools and Techniques for Success" 강의를 오픈 하였습니다.

'수업 및 프로필' 자세한 사항들은 수업 상세 페이지에 잘 작성했으니 참고 부탁드립니다  🙏🏻

Chương trình giảng dạy

Tất cả

36 bài giảng ∙ (4giờ 51phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

19 đánh giá

4.7

19 đánh giá

  • 귤껍데기님의 프로필 이미지
    귤껍데기

    Đánh giá 3

    Đánh giá trung bình 4.3

    5

    44% đã tham gia

    Tôi nghĩ đây là một khóa học có nội dung phong phú và phù hợp để bắt đầu. Cảm ơn bạn đã chuẩn bị khóa học này.

    • won831님의 프로필 이미지
      won831

      Đánh giá 1

      Đánh giá trung bình 5.0

      5

      19% đã tham gia

      Tôi là sinh viên kỹ thuật máy tính sắp tốt nghiệp và mong muốn trở thành kỹ sư dữ liệu. Trong khi tạo danh mục đầu tư liên quan đến công việc, tôi có rất nhiều lo lắng về cách định cấu hình quy trình và kiến ​​trúc để xử lý dữ liệu lớn cũng như cách thiết lập môi trường AWS để sử dụng nó một cách hiệu quả với chi phí thấp nhất có thể. bài giảng này và đạt được bí quyết. Đặc biệt, tôi rất vui vì mình đã thu được nhiều kiến ​​thức về các framework khác nhau xử lý dữ liệu lớn và nhận được nguồn cảm hứng về nơi tôi có thể nghiên cứu sâu hơn trong tương lai. Sau cơn hạn hán, ta gặp cơn mưa ngọt ngào. Tôi giới thiệu khóa học này cho những sinh viên quan tâm đến lĩnh vực này như tôi.

      • jphil
        Giảng viên

        Xin chào one831, Cảm ơn đánh giá có giá trị của bạn. Tôi hy vọng bạn có kết quả tốt trong tương lai.

    • youngmikwon님의 프로필 이미지
      youngmikwon

      Đánh giá 3

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      Cảm ơn!

      • jphil
        Giảng viên

        Xin chào Youngmi Kwon, Cảm ơn bạn đã đánh giá có giá trị của bạn! Chiến đấu!

    • jasonking님의 프로필 이미지
      jasonking

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      36% đã tham gia

      Tôi đã nghe bài giảng này sau khi tham gia một bài giảng về quy trình trước đó, và tôi rất vui vì nó đọng lại trong đầu tôi ~ Cảm ơn bài giảng cô đọng và thiết thực. Tôi nghĩ tôi sẽ học xong bài giảng này một cách nhanh chóng, nhưng tôi rất mong được xem liệu còn có những bài giảng khác nữa không.

      • Phải mất 2 ngày. Vì là dạng lab nên tiến triển hơi nhanh, nhưng rất khó để đào sâu vì namenode chưa khởi động (chắc do mình nhầm ở đâu đó). Sau này, tôi phát hiện ra rằng phần hướng dẫn xử lý sự cố đã tóm tắt kịch bản quy trình khởi động và phần xem nhật ký. Nếu tôi cũng nhìn thấy điều này, tôi đã có thể sửa chữa lỗi lầm của mình sớm hơn. Nếu bạn đang trải qua quá trình này, tôi nghĩ sẽ tốt hơn nếu bạn đọc kỹ và làm theo thay vì cố gắng sao chép mọi thứ. Người hướng dẫn. Cảm ơn bạn vì mỗi bài giảng hay ~

      • jphil
        Giảng viên

        Xin chào Jason.King, Cảm ơn bạn đã tham dự bài giảng của tôi :) Đôi khi việc suy nghĩ và cố gắng khắc phục khi gặp lỗi hoặc gặp khó khăn khi tự chụp sẽ rất hữu ích, vì vậy tôi nghĩ trải nghiệm này sẽ giúp ích rất nhiều trong tương lai. Nếu bạn tự xây dựng một nguồn mở chính, bạn sẽ có thể xây dựng một cụm trong thời gian ngắn ngay cả khi các nguồn mở khác xuất hiện. Tương lai cũng sẽ chiến đấu

    • upgleman8112423674님의 프로필 이미지
      upgleman8112423674

      Đánh giá 4

      Đánh giá trung bình 5.0

      5

      31% đã tham gia

      Từ lý thuyết đến phòng thực hành mã, đây là khóa học tôi đặc biệt giới thiệu cho người mới bắt đầu!! Tôi khuyên bạn nên tham gia khóa học xây dựng cụm dữ liệu lớn cần thiết này!!

      • jphil
        Giảng viên

        Xin chào Yeonwoo Jung, Cảm ơn bạn đã đánh giá có giá trị của bạn. Nếu bạn có cơ hội, hãy đầu tư một hoặc hai ngày và thử thực hành AWS, tôi hy vọng bạn sẽ thấy kết quả tốt. CHÚC MỪNG NĂM MỚI :)

    2.089.422 ₫

    Khóa học khác của jphil

    Hãy khám phá các khóa học khác của giảng viên!

    Khóa học tương tự

    Khám phá các khóa học khác trong cùng lĩnh vực!