Inflearn brand logo image
Inflearn brand logo image
Inflearn brand logo image
Data Science

/

Data Engineering

ビッグデータ クラスタ構築パッケージ; 成功へのロードマップ

高可用性が保証されるビッグデータシステムまたは分散処理システムクラスター(HDFS、Zookeeper、Spark、Zeppelin)を直接構築するコードラボ中心の授業です。

  • jphil
cluster
클러스터
빅데이터
실습 중심
Big Data
Apache Spark
Hadoop
Data Engineering

学習した受講者のレビュー

こんなことが学べます

  • Big Data クラスターの設定

  • 分散ファイル OR プロセッシング システム

  • High Availability

  • Hadoop

  • HDFS

  • Apache Spark

  • Apache Zeppelin

  • Apache Zookeeper

  • AWS (EC2、AMI、セキュリティ グループ)

ビッグデータ分散クラスタをコードラップを通じて実際に構築してみる、
ビッグデータクラスタ構築パッケージ
👨🏻‍🎓

こんにちはJ.PHILです🍏

ある学期が流れて良い機会を迎えて、今シーズンにはビッグデータ分散クラスタを直接皆さんが構築してみるビッグデータクラスタ構築パッケージ講義を進行しようと思います📚

皆さんの声援に支えられ、過去の「ビッグデータパイプラインマスター」授業のインスピレーションをもとに「多少チャレンジすることができるが、他の方向に有意義な講義があるのではないか?」悩みの末に一汗一汗丁寧に対応講義を製作しました。

Keyword: Big Data Cluster, Distributed System, High Availability, Hadoop, HDFS, Apache Spark, Zookeeper, Zeppelin, AWS EC2 & AMI

なぜ私たちは講義を聞くべきですか?

約10年を超える時間の間、急進的な技術発展により、さまざまなプラットフォームやサービスが右吊筍で生まれ、これを通じて生活から派生する無数のデータが活用・分析され、私たちは質の高い生活を営んでいます。

以下の図1。同様に、国内の巨大企業だけでなく、世界の巨人企業も、Big Data StorageとBig Data Processingの重要性は公然と強調しており、多くのエンジニアに同様の分析と構築スキルセットを求めています。

001.png

002.png

しかし、私たちが実際に該当するINDUSTRYに入るまでは、事前にBIG DATA CLUSTERを直接構築してみたり、取り扱うことができる経験を得ることは容易ではありません。それで、いざ重要な価値を得る機会が来た時、これに対する経験不足で残念な結果を迎えることもできます。

私も研究員時代に「DATA TOPTIER CONFERENCE」論文を書く際に50代のビッグデータクラスターを直接構築しなければならず、メンバーたちに率先して犯さなければならない負担感と課金に対する大きなストレスに耐えながら、一晩中昼間を築き、ひたすらクラスターを作りました。

もちろん、その時の大切な経験でたくさん学んで前進するのに良い滋養分になりましたが、私は皆さんがこんなに時間をやや非効率的に使いたくありません。つまり、皆さんの貴重な約200時間をクラスターを構築するのに使うのではなく、効率的にクラスター上に実験や顧客データ分析をすることに専念することを期待し、その講義を制作しました📝

何よりも皆さんが現在の講義を聞いてクラスタ構築経験を積んだ後、私のように直接現業や大学院でビッグデータクラスタを構築する際に大いに役立つことを願って、その講義は無制限に解いたので参考にしてください💓

私たちは何を学びますか

📝

Data Top-Tier Conference 論文を汗をかいた経験

👨🏻‍💼

現業で得た貴重なビッグデータシステムの構築と分析経験

🧑🏻‍🏫

長い間、大学で良い弟子たちを養成した経験

このように貴重な経験をもとに、その分野であなたが⚔️強力な武器を作れるように

1.高可用性が保証される分散ファイルシステムHDFSの上(下記のDaemonの例を参照)

2. ビッグデータシステム系 Masterpiece、 Apache Spark 、ビッグデータ専用ノートPC Zeppelin

クラスタパッケージを理論的でしっかりしたコードラップを通じて直接構築してみる予定です。

image.png

上記の高可用性ファイルシステムデーモン構成は少し難しく見えますか?もともと常に最初に見ているアーキテクチャとシステム構成図は負担になります。

しかし、

約6年間、優れた弟子たちの大切なフィードバックを振り返り、過去2つのInflearn講義を立ち上げた経験で、受講生の皆さんの目の高さに合わせて、次々とひとつずつ容易にできるだけ簡単で質の高いコンテンツで構成したので、気軽に follow upしていただいても大丈夫です。

special thanks to my lovely students 👨🏻‍🎓

カリキュラムについて教えてください🧑🏻‍🏫

まさにCODELABから始まらず、高可用性クラスターを構築する際に必要な理論から学習します。そして、AWS環境やLinux環境に慣れていない受講生のためにガイド映像やバックグラウンド知識を勉強し、本格的に深いコードラップを進行する予定です😎

curri-1.jpg

ビッグデータOR分散処理に関心のある誰でも受講可能です🧑🏻‍🎓

練習環境はどうなりますか? 💻

下記のような気軽な環境をご用意いただいても、十分に授業に従うことができます。

  • OS:Ubuntu 20.04 LTS

  • Editor: Vim (up to your preference)

  • マシン仕様

    • AWS EC2 / c5.large ( 2 Core 4GB ) 4台または5台

詳しくは、Course Curriculum視聴お願いします😊

J.PHILについて 👨‍👨‍👧‍👦

image.png

こんな方に
おすすめです

学習対象は
誰でしょう?

  • ビッグデータ処理システムのクラスタ構築を実際に体験したい受講生

  • データ分析およびシステムに興味があり、その職務を希望する学生

  • 高可用性クラスターの実践を直接体験したい開発者

  • ビッグデータ分析および構築分野で強みを築きたい就職希望者

前提知識、
必要でしょうか?

  • Python 基本コーディング

  • Linux コマンドの基本知識

  • データベースの基本知識

こんにちは
です。

448

受講生

39

受講レビュー

50

回答

4.9

講座評価

2

講座

안녕하세요 J.PHIL 입니다 🧑🏻‍🎓

첫번째 강의로 [ 빅데이터 시스템 구축 및 분석에 관심있는 입문자 ] 를 위해
"Mastering Big Data Processing: Tools and Techniques for Success" 강의를 오픈 하였습니다.

'수업 및 프로필' 자세한 사항들은 수업 상세 페이지에 잘 작성했으니 참고 부탁드립니다  🙏🏻

カリキュラム

全体

36件 ∙ (4時間 51分)

講座資料(こうぎしりょう):

授業資料
講座掲載日: 
最終更新日: 

受講レビュー

全体

19件

4.7

19件の受講レビュー

  • 귤껍데기님의 프로필 이미지
    귤껍데기

    受講レビュー 3

    平均評価 4.3

    5

    44% 受講後に作成

    Tôi nghĩ đây là một khóa học có nội dung phong phú và phù hợp để bắt đầu. Cảm ơn bạn đã chuẩn bị khóa học này.

    • won831님의 프로필 이미지
      won831

      受講レビュー 1

      平均評価 5.0

      5

      19% 受講後に作成

      Tôi là sinh viên kỹ thuật máy tính sắp tốt nghiệp và mong muốn trở thành kỹ sư dữ liệu. Trong khi tạo danh mục đầu tư liên quan đến công việc, tôi có rất nhiều lo lắng về cách định cấu hình quy trình và kiến ​​trúc để xử lý dữ liệu lớn cũng như cách thiết lập môi trường AWS để sử dụng nó một cách hiệu quả với chi phí thấp nhất có thể. bài giảng này và đạt được bí quyết. Đặc biệt, tôi rất vui vì mình đã thu được nhiều kiến ​​thức về các framework khác nhau xử lý dữ liệu lớn và nhận được nguồn cảm hứng về nơi tôi có thể nghiên cứu sâu hơn trong tương lai. Sau cơn hạn hán, ta gặp cơn mưa ngọt ngào. Tôi giới thiệu khóa học này cho những sinh viên quan tâm đến lĩnh vực này như tôi.

      • jphil
        知識共有者

        Xin chào one831, Cảm ơn đánh giá có giá trị của bạn. Tôi hy vọng bạn có kết quả tốt trong tương lai.

    • youngmikwon님의 프로필 이미지
      youngmikwon

      受講レビュー 3

      平均評価 5.0

      5

      100% 受講後に作成

      Cảm ơn!

      • jphil
        知識共有者

        Xin chào Youngmi Kwon, Cảm ơn bạn đã đánh giá có giá trị của bạn! Chiến đấu!

    • jasonking님의 프로필 이미지
      jasonking

      受講レビュー 2

      平均評価 5.0

      5

      36% 受講後に作成

      Tôi đã nghe bài giảng này sau khi tham gia một bài giảng về quy trình trước đó, và tôi rất vui vì nó đọng lại trong đầu tôi ~ Cảm ơn bài giảng cô đọng và thiết thực. Tôi nghĩ tôi sẽ học xong bài giảng này một cách nhanh chóng, nhưng tôi rất mong được xem liệu còn có những bài giảng khác nữa không.

      • Phải mất 2 ngày. Vì là dạng lab nên tiến triển hơi nhanh, nhưng rất khó để đào sâu vì namenode chưa khởi động (chắc do mình nhầm ở đâu đó). Sau này, tôi phát hiện ra rằng phần hướng dẫn xử lý sự cố đã tóm tắt kịch bản quy trình khởi động và phần xem nhật ký. Nếu tôi cũng nhìn thấy điều này, tôi đã có thể sửa chữa lỗi lầm của mình sớm hơn. Nếu bạn đang trải qua quá trình này, tôi nghĩ sẽ tốt hơn nếu bạn đọc kỹ và làm theo thay vì cố gắng sao chép mọi thứ. Người hướng dẫn. Cảm ơn bạn vì mỗi bài giảng hay ~

      • jphil
        知識共有者

        Xin chào Jason.King, Cảm ơn bạn đã tham dự bài giảng của tôi :) Đôi khi việc suy nghĩ và cố gắng khắc phục khi gặp lỗi hoặc gặp khó khăn khi tự chụp sẽ rất hữu ích, vì vậy tôi nghĩ trải nghiệm này sẽ giúp ích rất nhiều trong tương lai. Nếu bạn tự xây dựng một nguồn mở chính, bạn sẽ có thể xây dựng một cụm trong thời gian ngắn ngay cả khi các nguồn mở khác xuất hiện. Tương lai cũng sẽ chiến đấu

    • upgleman8112423674님의 프로필 이미지
      upgleman8112423674

      受講レビュー 4

      平均評価 5.0

      5

      31% 受講後に作成

      Từ lý thuyết đến phòng thực hành mã, đây là khóa học tôi đặc biệt giới thiệu cho người mới bắt đầu!! Tôi khuyên bạn nên tham gia khóa học xây dựng cụm dữ liệu lớn cần thiết này!!

      • jphil
        知識共有者

        Xin chào Yeonwoo Jung, Cảm ơn bạn đã đánh giá có giá trị của bạn. Nếu bạn có cơ hội, hãy đầu tư một hoặc hai ngày và thử thực hành AWS, tôi hy vọng bạn sẽ thấy kết quả tốt. CHÚC MỪNG NĂM MỚI :)

    ¥11,773

    jphilの他の講座

    知識共有者の他の講座を見てみましょう!

    似ている講座

    同じ分野の他の講座を見てみましょう!