강의

멘토링

로드맵

Data Science

/

Data Engineering

빅데이터 클러스터 xây dựng gói; lộ trình hướng tới thành công

Đây là khóa học tập trung vào codelab, trong đó bạn sẽ tự xây dựng hệ thống dữ liệu lớn hoặc cụm hệ thống xử lý phân tán có khả năng bảo đảm độ khả dụng cao (HDFS, Zookeeper, Spark, Zeppelin).

(4.8) 20 đánh giá

114 học viên

  • jphil
cluster
클러스터
빅데이터
실습 중심
Big Data
Apache Spark
Hadoop
Data Engineering

Đánh giá từ những học viên đầu tiên

Dịch cái này sang tiếng Việt

  • Cài đặt Big Data Cluster

  • Hệ thống xử lý tệp phân tán

  • Khả năng cao

  • Hadoop

  • HDFS

  • Tia lửa Apache

  • Zeppelin của Apache

  • Người trông coi sở thú Apache

  • AWS (EC2, AMI, Nhóm bảo mật)

Xây dựng cụm phân tán dữ liệu lớn thông qua phòng thí nghiệm mã.
Gói xây dựng cụm dữ liệu lớn
👨🏻‍🎓

Xin chào, tôi là J.PHIL 🍏

Khi một học kỳ đã trôi qua và một cơ hội tốt đã đến, mùa này chúng tôi sẽ tổ chức một bài giảng có tiêu đề ' Gói xây dựng cụm dữ liệu lớn ', nơi bạn sẽ tự mình xây dựng một cụm dữ liệu phân tán lớn 📚

Nhờ sự hỗ trợ của bạn, lấy cảm hứng từ lớp học "Big Data Pipeline Master" trước đó, tôi đã tự hỏi: "Liệu có khóa học nào vừa thử thách vừa có ý nghĩa hơn không?" Sau nhiều lần cân nhắc, tôi đã dày công xây dựng khóa học này.

Từ khóa: Cụm dữ liệu lớn, Hệ thống phân tán, Tính khả dụng cao, Hadoop, HDFS, Apache Spark, Zookeeper, Zeppelin, AWS EC2 & AMI

Tại sao chúng ta nên tham dự các bài giảng 🙇🏻

Trong thập kỷ qua, những tiến bộ nhanh chóng về công nghệ đã dẫn đến sự phát triển của các nền tảng và dịch vụ, cho phép chúng ta sử dụng và phân tích lượng lớn dữ liệu được tạo ra từ cuộc sống hàng ngày, giúp chúng ta có được chất lượng cuộc sống cao hơn.

Như thể hiện trong Hình 1 bên dưới, không chỉ các tập đoàn lớn trong nước mà cả các tập đoàn toàn cầu cũng công khai nhấn mạnh tầm quan trọng của Lưu trữ dữ liệu lớn và Xử lý dữ liệu lớn, đồng thời yêu cầu nhiều kỹ sư có kỹ năng phân tích và xây dựng tương tự.

001.png

002.png

Tuy nhiên, trước khi bước vào ngành , việc tích lũy kinh nghiệm thực tế trong việc xây dựng hoặc quản lý một CỤM DỮ LIỆU LỚN là rất khó khăn . Do đó, khi có cơ hội tạo ra giá trị có ý nghĩa, việc thiếu kinh nghiệm có thể dẫn đến những kết quả đáng thất vọng.

Khi còn là một nhà nghiên cứu, tôi đã phải tự mình xây dựng một cụm dữ liệu lớn gồm 50 người trong khi viết bài báo cho 'HỘI NGHỊ HÀNG ĐẦU DỮ LIỆU'. Tôi đã phải chịu đựng gánh nặng phải làm gương cho các thành viên và áp lực lớn khi phải trả tiền, và tôi đã thức trắng đêm suốt hai tuần , chỉ tập trung vào việc xây dựng cụm dữ liệu.

Tất nhiên, tôi đã học được rất nhiều từ trải nghiệm quý báu đó, và nó đã trở thành hành trang quý báu cho tương lai của tôi. Tuy nhiên , tôi không muốn bạn lãng phí thời gian một cách vô ích như vậy. Nói cách khác, tôi tạo ra khóa học này với hy vọng rằng bạn sẽ không chỉ dành 200 giờ quý báu của mình để xây dựng một cụm, mà thay vào đó, hãy dành thời gian đó để thực hiện các thí nghiệm hoặc phân tích dữ liệu khách hàng một cách hiệu quả . 📝

Trên hết, tôi hy vọng rằng sau khi bạn tham gia bài giảng hiện tại và tích lũy kinh nghiệm xây dựng cụm, nó sẽ giúp ích rất nhiều cho bạn khi xây dựng một cụm dữ liệu lớn ngoài thực tế hoặc trong quá trình học sau đại học như tôi. Hãy tham khảo bài giảng vì nó không giới hạn.💓

Chúng ta sẽ học được 📚

📝

Kinh nghiệm viết bài báo cho hội nghị dữ liệu hàng đầu

👨🏻‍💼

Kinh nghiệm quý báu trong việc xây dựng và phân tích các hệ thống dữ liệu lớn có được từ thực tế

🧑🏻‍🏫

Kinh nghiệm lâu năm trong việc bồi dưỡng sinh viên giỏi tại trường đại học

Với kinh nghiệm quý báu này, chúng tôi hy vọng có thể giúp bạn tạo ra một vũ khí mạnh mẽ ⚔️ trong lĩnh vực của mình.

1. Trên HDFS , một hệ thống tệp phân tán đảm bảo tính khả dụng cao (xem ví dụ Daemon bên dưới)

2. Kiệt tác hệ thống dữ liệu lớn: Apache Spark Zeppelin , một máy tính xách tay chuyên dụng cho dữ liệu lớn

Chúng tôi sẽ tự xây dựng gói cụm thông qua lý thuyết và phòng thí nghiệm mã vững chắc.

image.png

Bạn có thấy các cấu hình daemon hệ thống tệp có tính khả dụng cao ở trên có vẻ hơi phức tạp không? Lần đầu tiên nhìn thấy sơ đồ kiến trúc và cấu hình hệ thống có thể khiến bạn choáng ngợp.

Nhưng

Dựa trên phản hồi quý báu từ những học viên xuất sắc trong sáu năm qua và kinh nghiệm triển khai hai khóa học Inflearn gần đây, chúng tôi đã sắp xếp nội dung thành những nội dung dễ hiểu, chất lượng cao, được thiết kế theo từng bước, phù hợp với trình độ của học viên . Mời bạn theo dõi.

lời cảm ơn đặc biệt tới các học sinh đáng yêu của tôi 👨🏻‍🎓

Xin hãy cho tôi biết về chương trình giảng dạy 🧑🏻‍🏫

Thay vì bắt đầu trực tiếp với CODELAB, chúng ta sẽ bắt đầu bằng việc tìm hiểu lý thuyết xây dựng một cụm máy chủ có tính sẵn sàng cao . Đối với những học viên chưa quen với môi trường AWS hoặc Linux, chúng ta sẽ xem các video hướng dẫn và tìm hiểu kiến thức nền tảng trước khi chuyển sang các bài thực hành lập trình chuyên sâu .

curri-1.jpg

Bất kỳ ai quan tâm đến dữ liệu lớn hoặc xử lý phân tán đều có thể tham gia khóa học này 🧑🏻‍🎓

Môi trường đào tạo như thế nào?

Bạn có thể theo học lớp học một cách thoải mái bằng cách chuẩn bị một môi trường học tập thoải mái như minh họa bên dưới.

  • Hệ điều hành: Ubuntu 20.04 LTS

  • Biên tập viên: Vim (tùy theo sở thích của bạn)

  • Thông số kỹ thuật máy

    • AWS EC2 / c5.large ( 2 lõi 4GB ) 4 hoặc 5 đơn vị

Vui lòng xem Chương trình giảng dạy của khóa học để biết thêm chi tiết 😊

Giới thiệu J.PHIL 👨‍👨‍👧‍👦

image.png

Khuyến nghị cho
những người này

Khóa học này dành cho ai?

  • Sinh viên muốn trải nghiệm trực tiếp việc xây dựng cụm hệ thống xử lý dữ liệu lớn

  • Sinh viên quan tâm và tìm kiếm sự nghiệp trong phân tích dữ liệu và hệ thống

  • Các nhà phát triển muốn có được kinh nghiệm thực tế với các cụm có tính khả dụng cao

  • Người tìm việc muốn phát huy thế mạnh trong phân tích và xây dựng dữ liệu lớn

Cần biết trước khi bắt đầu?

  • Lập trình cơ bản bằng Python

  • Kiến thức cơ bản về lệnh Linux

  • Kiến thức cơ bản về cơ sở dữ liệu

Xin chào
Đây là

452

Học viên

40

Đánh giá

50

Trả lời

4.9

Xếp hạng

2

Các khóa học

안녕하세요 J.PHIL 입니다 🧑🏻‍🎓

첫번째 강의로 [ 빅데이터 시스템 구축 및 분석에 관심있는 입문자 ] 를 위해
"Mastering Big Data Processing: Tools and Techniques for Success" 강의를 오픈 하였습니다.

'수업 및 프로필' 자세한 사항들은 수업 상세 페이지에 잘 작성했으니 참고 부탁드립니다  🙏🏻

Chương trình giảng dạy

Tất cả

36 bài giảng ∙ (4giờ 51phút)

Tài liệu khóa học:

Tài liệu bài giảng
Ngày đăng: 
Cập nhật lần cuối: 

Đánh giá

Tất cả

20 đánh giá

4.8

20 đánh giá

  • 귤껍데기님의 프로필 이미지
    귤껍데기

    Đánh giá 3

    Đánh giá trung bình 4.3

    5

    44% đã tham gia

    내용이 알차고 처음 시작하기에 좋은 강의라고 생각되네요. 이런 강의를 준비해 주셔서 감사합니다.

    • one831님의 프로필 이미지
      one831

      Đánh giá 1

      Đánh giá trung bình 5.0

      5

      19% đã tham gia

      곧 졸업을 앞둔, 데이터 엔지니어를 지망하는 컴공과 학생입니다. 취업 관련 포트폴리오를 만들면서, 빅데이터를 처리하기 위한 파이프라인 및 아키텍쳐를 어떻게 구성하고, 어떤 식으로 aws 환경을 설정하여 최대한 낮은 비용으로 효율적으로 이용할 수 있을지 고민이 많았었는데, 본 강의를 통해 엄청난 인사이트와 노하우들을 얻어갑니다. 특히, 빅데이터를 다루는 다양한 프레임워크들에 대한 많은 지식도 얻게 되어 앞으로 어느쪽으로 파고들수 있을지 영감을 얻은 것 같아 기쁩니다. 가뭄 끝에 단비를 만났습니다. 저와 같이 이쪽 분야를 지망하시는 학생분들께 수강 추천드립니다.

      • J.PHIL
        Giảng viên

        안녕하세요 one831님, 소중한 수강평 감사드리며, 앞으로도 좋은 결과 있기를 바랍니다 화이팅입니다

    • 권영미님의 프로필 이미지
      권영미

      Đánh giá 3

      Đánh giá trung bình 5.0

      5

      100% đã tham gia

      감사합니다!

      • J.PHIL
        Giảng viên

        안녕하세요 권영미님, 소중한 수강평 감사드립니다! 화이팅입니다

    • Jason.king님의 프로필 이미지
      Jason.king

      Đánh giá 2

      Đánh giá trung bình 5.0

      5

      36% đã tham gia

      이전에 파이프라인 강의를 듣고 본 강의를 듣고 있는데 머리속에 잘 들어와서 너무 좋아요~ 컴팩트하고 실무에 쓰일 강의 감사해요~ 이 강의도 금방 들어버릴 것 같은데 다른 강의도 있을지 기대됩니다.

      • 2일 걸렸네요. lab 형식이라 좀 빠르게 진행되고 , namenode 기동이 안되어서 삽질하느라 어려웠는데 (아마 어딘가 실수하여 그런듯) 나중에 보니 trouble shoot guide 부분에 기동절차 스크립트 및 로그 보는 부분 정리해 두셨네요. 이것도 봤다면 좀더 빨리 실수를 복구했을텐데 ㅜㅜ 혹시 진행하시는 분들은 모두 따라 치는 것보다는 한번 정독하고 따라하는 것도 좋을 것 같아요~ 강사님. 좋은 강의 매번 감사해요~

      • J.PHIL
        Giảng viên

        안녕하세요 Jason.King 님, 제 이번 강의를 열심히 수강해주셔서 감사합니다 :) 때때로 버그나 trouble shooting을 직접 겪어보면서 고민해보고 복기해보는 것이 많이 도움이 될 때가 있을테니 오히려 이번 경험이 추후 큰 도움될거라 사료됩니다. 굵직한 오프소스를 직접 구축해보면 클러스터를 구축해보셨으니 다른 오프소스가 나와도 이제 빠른 시간에 잘 구축하실 수 있을겁니다. 앞으로도 화이팅입니다

    • Yeonwoo Jung님의 프로필 이미지
      Yeonwoo Jung

      Đánh giá 4

      Đánh giá trung bình 5.0

      5

      31% đã tham gia

      이론 부터 코드랩까지 초기 입무자에게 정말 추천하는 강의 입니다!! 빅데이터 클러스터 구축 강의로 필수로 수강하길 추천합니다!!

      • J.PHIL
        Giảng viên

        안녕하세요 Yeonwoo Jung님, 소중한 수강평 감사합니다. 기회될 때 하루이틀 투자하셔서 AWS 로 실습을 따라해보셔서 좋은 성과 있기를 바랍니다. 새해 복 많이 받으세요 :)

    2.089.184 ₫

    Khóa học khác của jphil

    Hãy khám phá các khóa học khác của giảng viên!

    Khóa học tương tự

    Khám phá các khóa học khác trong cùng lĩnh vực!