Thumbnail
데이터 사이언스 데이터 수집 · 처리
Hadoop 3.2.1 and Big data
(4.6)
14개의 수강평 ∙ 151명의 수강생

55,000원

지식공유자 : Billy Lee
총 50개 수업˙총 5시간 56분
평생 무제한 수강
수료증 발급 강의
입문 초급 대상 중급이상
폴더에 추가 327 공유
초급자를 위해 준비한
[데이터 수집 · 처리, 데이터 사이언스] 강의입니다.

하둡과 빅데이터를 배우고자 하는 수강생들은 이 과정을 통해 빅데이터 세계를 경험하는 놀라운 발전을 기념할 것입니다!!

✍️
이런 걸
배워요!
일상에서 빅데이터 기술 접하기
하둡으로 빅데이터 다루기
하둡으로 빅데이터를 다루는 분산처리 기술 배우기
자바 언어를 이용하여 하둡 빅데이터 다루기
관계형 데이터 처리 한계를 하둡으로 뛰어넘는 기술 배우기
하둡의 다양한 프로젝트이자 인터페이스들을 배우기

바야흐로 빅데이터 시대! 👨‍💻
하둡(Hadoop)으로 전문가가 되어보세요.

데이터 사이언스의 중심,
대세는 하둡!

여러 IT 대기업, 소셜 미디어 서비스 등에서 빅데이터 분석 및 처리에 하둡(Apache Hadoop)을 앞다투어 사용하고 있습니다. 하둡은 대량의 자료를 적은 비용으로 처리할 수 있도록 만들어진 자바(Java) 언어 기반의 프레임워크로, 대규모 데이터 세트를 분산 저장하고 처리해 줍니다. 그런데, 그런 하둡을 통해 빅데이터 전문가 수준의 반열에 올라갈 수 있다면 어떨까요?

기업들은 데이터 분석을 통해 새로운 시장을 개척하고 희소성있는 가치를 부여하며, 새로운 소비자들에게 필요한 정보를 실시간으로 제공할 수 있는 쾌감을 부여할 수 있게 될 겁니다. 중소기업 또한 빅데이터는 꼭 다뤄야 할 필수 사항인 만큼, 빅데이터 관련 직무로 취업/이직을 꿈꾸는 분들께는 희소식이 아닐 수 없습니다.

BigData with Hadoop

구글, 야후, 페이스북, IBM, 인스타그램, 트위터 등
여러 기업에서 데이터 분석에 사용하고 있는
대표적인 빅데이터 솔루션, 하둡(Hadoop)을 통해
빅데이터 분산형 시스템 인프라를 구축해 봅니다.

이 강의는 빅데이터 용어에 대한 이해를 시작으로 공개 소프트웨어 하둡(Hadoop)을 통해 빅 데이터를 다루는 과정을 간접 체험할 것입니다. 이 강의를 통해 수강생 여러분은 빅데이터 테크놀로지 (Big Data Technology) 세계, 그리고 4차 혁명의 세계를 동시에 경험할 수 있게 됩니다.

하둡(Hadoop)이란?

  • 하둡은 공개형 소프트웨어로, 누구나 무료로 사용할 수 있는 오픈소스(Open Source)입니다.
    이 강의에서는 하둡 3.2.1 버전을 통해 빅데이터를 다룰 것입니다.

빅데이터 이해부터
하둡 사용법까지
한번에 OK.

빅 데이터
용어에 대한
필수적인 이해
하둡(Hadoop)
개념과 용도에
대한 소개
하둡을 통한
빅데이터 처리
학습 튜토리얼

이런 분들께 추천해요!

물론, 여기에 해당되지 않는 분들도 환영해요. (초보자는 2배로 환영합니다 ✌)

취업/이직
고려하는 미래형 IT
데이터사이언스 준비생
자바/파이썬을 통해
빅데이터를 다루고자
하시는 분
관심과 흥미
빅데이터에 대해
경험해보고 싶은 분
하둡 3.x 버전
데이터 환경 등을
경험하고픈 직장인

수강 전, 선수 지식을 확인해주세요!

  • 선수 지식으로 자바(Java) 프로그래밍 언어 기초, 빅데이터가상머신/데이터 셋 관련 용어에 대한 지식과 리눅스 우분투(Linux Ubuntu)에 대한 기본적인 이해가 필요합니다.

다음 내용을
학습합니다.

1. 가상화 기술 도전 및 게스트 운영체제에 대한 이해

서버 통합에 유리한 가상화 기술을 배우며 OS 레벨 가상화를 통해 하나의 OS로 여러 대의 서버를 분리시키는 방식을 기초로 배울 예정입니다. 리눅스에 적용할 수 있는 가상화 방식인 오픈 소스 솔루션 우분투(Ubuntu)를 통해 누구나 도전하여 다량의 서버를 제작 운영하게 될 것입니다. 나아가, 게스트 운영체제에 대한 지식은 물론 다량의 서버를 통해 빅 데이터를 분산 기술로 바꾸게 되며 벌어지는 다량의 기술 경험을 축적할 수 있게 됩니다. 서버 가상화를 이용하여 하나의 물리적인 서버에서 혹은 운영체제에서 매우 효율적인 가상 머신의 어려 운영체제를 경험할 수 있는 특혜(?)를 누릴 수 있죠.

  • 빅 데이터(Big Data)의 정의 및 실제 적용 사례에 대해 알아봅니다.
  • 기업에서 선호하는 데이터 처리 소프트웨어인 하둡(Hadoop) 관련 용어를 이해해 봅니다.
Data Sizes
The Landscape : Big Data

2. Ubuntu 20.04 LTS 위에 하둡을 설치하고 명령어를 조작하는 법

프론트엔드(FrontEnd) 개발자가 웹 애플리케이션을 개발할 때 자연스럽게 마주치는 리눅스 CLI(Command Line Interface) 방식의 도구를 사용하는 기초 방법부터, 하둡을 다루게 되는 리눅스 터미널을 자연스럽게 배울 예정입니다. 물론 비(非) Windows 기반의 GUI 환경에서 원도처럼 우분투를 사용하기 위한 제반 사항을 배우면서, 셀의 설정 파일과 같은 리눅스 시스템의 이해를 넘어 중급자 방향으로 자연스럽게 인도할 것입니다.

  • 윈도 10 기반 노트북에 가상머신으로 리눅스(Ubuntu 20.04 LTS)를 설치하고 설정해 봅니다.
  • 리눅스 가상머신 위에 하둡 3.2.1 버전을 설치합니다. 
Hadoop 2.x Architecture
Hadoop 2.x vs. 3.x

3. Hadoop 3.2.1 최신 방향 가이드 & 핵심 아키텍처 구조 이해

비정형 데이터 처리를 위한 빅데이터의 시작은 구글의 파일 시스템의 모형인 하둡 분산 파일 시스템(HDFS)과 맵리듀스(MapReduce), 그리고 얀(YARN)이라는 클러스터 확장 및 리소스 관리에 대한 이해입니다. 하둡버전 1, 2, 3의 아키텍쳐 구조에 대해 하나하나 살펴보며, 하둡 기술의 역사가 어떠한지 수강생 여러분께 그림을 그려드릴 것입니다.

  • 하둡 분산 파일 시스템(HDFS)을 이해하고 연동해 봅니다.
  • 맵리듀스(Map/Reduce) 프레임워크의 원리를 이해하고, 이를 근거로 데이터를 분석해 봅니다.
HDFS Architecture
YARN Core Components

4. HDPS 셸 조작 가이드 및 자바/파이썬으로 맵리듀스 애플리케이션 제작하기

데이터 조작에 쓰이는 기술은 다양하지만, 빅데이터 분석의 기초는 맵리듀스 애플리케이션 제작에 있습니다. 프로그래밍 언어 파이썬(Python)으로 기본 워드카운트 맵리듀스 애플리케이션부터 이클립스(Eclipse) 기반의 자바(Java) 언어로 COVID-19 애플리케이션 제작에 이르기까지, 다양한 빅데이터 맵리듀스 애플리케이션 제작은 이제 선택을 넘어 필수로 나아가야 할 방향을 제시할 것입니다. 

  • 자바(Java)로 하둡을 연동하고, 애플리케이션을 구현해 봅니다.
  • 파이썬(Python)으로 하둡을 연동하고, 애플리케이션을 구현해 봅니다.
Python Map/Reduce WordCount Application
Java Map/Reduce WordCount Application

예상 질문 Q&A!

Q. 빅데이터란 무엇인가요? 하둡을 사용할 때 그 정의가 필요한가요?

네, 당연히 하둡(Hadoop)을 다룰 때 반드시 빅데이터에 대한 간략한 정의 및 이해를 요구합니다. 물론 완벽하고 깊이있는 수준의 숙지를 요구할 정도는 아닙니다. 다만 하둡을 다룰 때 꼭 필요한 이해 정도를 요구하는 형태겠죠.

빅데이터는 하둡 툴을 가지고 매우 큰 데이터셋을 다룹니다. 이 데이터셋은 수많은 기업들이 다루는 여러 패턴 및 트렌드를 파악하기 위해 분석하는 기초 데이터입니다. 인간의 사회적 행동 및 패턴, 그리고 상호작용 가운데 벌어지는 인류의 가치 창출과 연관이 서려 있지요.

이미지 출처: TechTarget (원문 바로가기)

Q. 하둡이 무엇인가요? 컴포넌트는 무엇이고, 하둡 스택은 또 무엇인가요?

테라바이트를 넘어 페타(Petta/Zettabyte)에 이르는 대규모 소셜 사이트의 데이터를 처리해야 하는 사명을 하둡이 돕고 있습니다. 하둡 스택(Hadoop Stack)이란 이런 빅데이터를 다루는 오픈 소스 프레임워크 방식을 가리킵니다.

단순히 ‘하둡’은 ‘하둡 스택’이라고 불립니다. 싸고 일상적인 커머디티 하드웨어(Commodity hardware)를 사용하여 클러스트를 제작하고 그 방대한 서버들의 집합체인 클러스트 내에 대용량 프로세스 처리를 하도록 돕는 것이 하둡이자 하둡 스택이죠. 하둡 스택은 ‘단순 배치 프로세스’라고도 하며, 자바 기반의 '분산 컴퓨팅 플랫폼'입니다. 그래서 개인이 원하는 만큼의 데이터를 주기별로 배치를 돌리며 처리하면서, 데이터들을 원하는 형태로 가공 분산하여 결과값을 산출하는 것이죠.

Q. 프로그래밍 지식이 필요한가요?

프로그래밍에 대한 지식이나 코드 작성 경험이 없어도 괜찮습니다. 자바나 파이썬을 처음 경험한다고 생각하고 가르칠 수 있도록, 깊이있는 이해를 바탕으로 수업을 진행합니다. 강의에 쓰인 문서는 영어로 되어 있지만 따라하시는 데는 지장이 없도록 한국어로 강의합니다. 간혹 영어로 설명을 하기는 하지만, 고등학교 수준이면 해석할 수 있지 않을까요? (저의 낮은 영어실력으로도 꿈을 이룬 것처럼요.)

Q. 하둡을 다루는데 빅 데이터는 어느 정도 연관이 있나요?

이 강의는 당연히 하둡을 다루고 있습니다. 단순히 RDMS라는 오라클이나 MSSQL, 혹은 MYSQL을 넘어서 대용량 처리를 시작으로 데이터 처리 속도 문제, 저비용 효과라는 기업의 필수 요소를 창출하고자 합니다. 특히 소셜을 다뤄야 하는 기업들, 즉 곧 로우와 컬럼에 기초한 데이터 RDMS에서 다루는 관계형 데이터를 다루는 스트럭쳐 데이터(Structured data)뿐만 아니라, 이미지, 오디오, 워드 프로세스 파일 그 자체를 다뤄야 하는 언스트럭쳐 데이터(Unstructred data) 등도 하둡이 다루게 됩니다.

서비스 스트럭쳐 데이터를 다룰 때는 Email, CSV, XML, and JSON 과 같은 웹 서버와의 통신과 데이터 연동에 관련된 데이터를 말하고 있죠. HTML, Web Sites, NoSQL Databases 역시도 여기에 포함됩니다. 물론 EDI라는 비지니스 서류 관련 전산 이동시키는 컴퓨터 대 컴퓨터 간의 이동 처리 문제를 다룰 때 쓰는 데이터셋 누적도 역시 여기에 속하죠.

이미지 출처: MonkeyLearn Blog (원문 바로가기)

Q. 어느 정도 수준까지 내용을 다루나요?

이 강의는 Ubuntu(우분투) 20.04 LTS 기반에 Hadoop(하둡) 3.2.1을 직접 사용자가 설치할 수 있도록 도와줍니다. 유닉스나 리눅스 경험이 없어도 자연스럽게 따라오시면 리눅스를 바탕으로 이어지는 설치 요령 및 리눅스 운영체제를 자연히 숙지하게 됩니다. 또한 하둡이 다루는 CLI 언어나 사용자 언어를 익히는 기초적인 부분을 넘어, 구글이 가지고 있는 기술인 DFS and MapReduce 기술에 익숙해지도록 도와줄 것입니다. YARN(얀)에 대한 이해는 기초 이론만 가지게 되며, 추후 하둡 3.3.0 중급 과정에서 클러스트를 설치하면서 얀에 대한 보다 깊이있는 학습을 기대하시길 바랍니다.

Q. Ubuntu 20.04 LTS를 실습 환경으로 사용하는 이유가 있나요?

우분투(Ubuntu)는 무료로 사용할 수 있고, LTS(Long-Term Service)를 통해 장기 서비스 지원을 꿈꾸는 기업을 대상으로 하둡을 리눅스에서 설치하면서 자연스럽게 기업이 요구하는 운영체제 및 개발 환경을 구축할 수 있도록 돕고 있습니다. 동일한 환경 내에 이클립스나 인텔리전트를 사용하도록 도움으로써, 당장 빅데이터를 다루는 데이터 과학의 꿈을 실현시키는 데 함께 이바지하도록 하는 좋은 시간이 될 것입니다.

우분투는 윈도우 운영체제의 설치 및 운영과
비슷한 환경, 즉 GUI(그래픽 유저 인터페이스)
환경을 통해 사용자를 돕고 있죠.

지식공유자가 알려주는
강의 수강 꿀팁!
🎓
이런 분들께
추천드려요!
빅데이터의 기초를 처음부터 배우고자 하는 열공생
빅데이터 원리와 적용에 목말라하시는 분
데기업의 빅데이터를 다루고자 하둡을 배우고 싶은 분들
자바에 기초 지식이 있으신 분들
📚
선수 지식,
필요한가요?
The Concept of Big Data (빅데이터 이해)
자바
가상머신
데이터 셋 용어
리눅스 이해(Ubuntu)

안녕하세요
Billy Lee 입니다.
Billy Lee의 썸네일

네오아베뉴 대표 빌리 리 입니다.
캐나다에서 센터니얼 칼리지 Software Eng. Technician 졸업한 열공생이자
한국에서는 9년의 자바 경력 소유자로 빅데이터 관련 금융권에 근무한 화려한(?) 경력자로 등극되어 있습니다.
2년 이상은 한국 기업의 소유권이 있는 CRM 플랫폼 연구진에서도 CRM/SFA 웹 솔류션을
개발 리드한 경력으로 현재 캐나다에서 거주하며 자녀 둘을 키우는 착실한 스마트 개발자입니다.
2019년, 핸디맨 어플 Scrum Master로서 에자일 개발 방식을 채택하여 미주 캐나다 지역의 실경험자입니다.
C#/.NetMVC/NodeJS/AgularJS/VueJS 실력자이며 한국에 2020년 초 잠시 귀국하여 KT 금융마케팅 플랫폼에도 손을 댄 Scrum Master로 프로젝트 관리자 역할을 톡톡히 해낸 경험도 있습니다.

커리큘럼 총 50 개 ˙ 5시간 56분의 수업
이 강의는 영상, 수업 노트, 첨부 파일이 제공됩니다. 미리보기를 통해 콘텐츠를 확인해보세요.
섹션 0. 빅 데이터란 과연 무엇인가?
What is Big Data (빅 데이터란 무엇인가)? 미리보기 03:49
A Long History of Big Data(데이터는 언제 부터 생겼는지 아세요?) 06:11
빅 데이터가 가지고 있는 구성 요소와 종류는 무엇인가? 04:08
섹션 1. 빅 데이터 기술은 기업들에게 왜 중요한 것인가?
빅 데이터 기술을 찾아나선 풍경 미화 미리보기 03:33
앞다퉈 빅데이터를 다루는 기업들은 얼마나 많은가? 02:55
섹션 2. 하둡이란 도대체 무엇이란 말인가?
하둡의 탄생과 그 역사적 배경을 연구하는 이유는? 04:06
하둡 혹은 하둡 스텍이란 도대체 무엇인가? 미리보기 04:56
하둡 스텍의 핵심 원리와 다섯 가지 이득은 무엇일까? 05:31
섹션 3. 하둡의 네 가지 기본 핵심 모듈(컴포넌트)은 무엇에 쓰는 도구인가?
하둡의 네 가지 컴포넌트 혹은 핵심 모듈(핵심 기술) 나열하기 미리보기 03:26
핵심 모듈[1]-하둡의 공통 모듈-Hadoop Common Module 02:01
핵심 모듈[2]-하둡 분산 처리 파일 시스템 모듈(Hadoop Distributed File System)-HDFS Module 05:03
핵심 모듈[3]-맵리듀스 모듈-MapReduce Module 06:37
핵심 모듈[4]-얀 모듈-YARN Modules 04:50
섹션 4. 하둡 제너럴[1] : 하둡 설치 [1] - 가상 머신의 이해와 설치하기
하둡 설치에 대한 순서 이해하기
내 PC에 가상화 지원하기 위한 사전 작업 해보기
가상화 기술에 대한 이해하기 - 가상 머신 03:57
버추얼 박스(VirtualBox 6.1.8. ) 설치 요령 (확장판 다운로드 포함) 02:28
버추얼박스 설정 (Preferences)에서 확장판 패키지 파일 추가하기 02:57
섹션 5. 하둡 제너럴[2] : 하둡 설치[2] - Hadoop 3.2.1 설치하기
버추얼박스 위에 Ubuntu 20.04 LTS 연결하여 설치해보자!! 07:11
유분트 터미널로 하둡 3.2.1 설치 시작하기[1] - 사전 작업 07:16
유분트 터미널로 하둡 3.2.1 설치 시작하기[2] - 하둡 설치 및 DFS 데몬 실행 미리보기 07:36
섹션 6. 하둡 제너럴[3] : 하둡 파일 시스템 쉘 명령어 (Hadoop File System Shell Commands)
하둡 제너럴(Hadoop General)[1] : 하둡 기본 명령어 구조와 규약 미리보기 04:19
하둡 제너럴(Hadoop General) [2] : 하둡 명령어 배우기 - FS(Files System) Shell (1) 08:26
하둡 제너럴(Hadoop General) [2]: 하둡 명령어 배우기 - FS(Files System) Shell(2) 06:31
하둡 제너럴(Hadoop General) [2]: 하둡 명령어 배우기 - FS(Files System) Shell(3) 03:06
하둡 제너럴(Hadoop General) [2]: 하둡 명령어 배우기 - FS(Files System) Shell(4) 05:57
하둡 제너럴(Hadoop General) [3]: 하둡 스몰 프로젝트(로컬 데이터를 하둡 시스템으로 로딩해보기) 04:44
섹션 7. 하둡 제너럴[4]- 하둡 공통 명령어들 (Hadoop Common Commands)
하둡 공통 명령어 : 사용자 명령어(User Commands)[1] 06:59
하둡 공통 명령어 : 사용자 명령어(User Commands)[2] 08:43
섹션 8. HDFS(하둡 분산 처리 시스템) 구조 배우기- 하둡의 핵심 기술 내부 아키텍쳐[1]
하둡 아키텍쳐 기본 구조 - Hadoop version 1.x and 2.x 06:11
하둡 아키텍쳐 기본 구조 - Hadoop version 2.x and 3.x (I) 09:41
하둡 아키텍쳐 기본 구조 - Hadoop version2.x and 3.x (II) 07:38
하둡 아키텍쳐 핵심 요소[1] - 마스터 슬레이브 테크놀로지 구조 03:26
하둡 아키텍쳐 핵심 요소[2]- 복제 관리 매커니즘(Replication management) 02:30
하둡 아키텍쳐 핵심 요소[3]- 렉 인지 (Rack Awareness) 07:08
하둡 아키텍쳐 핵심 요소[4]- Read/Write Architecture 09:08
섹션 9. MapReduce
맵리듀스 기본 튜토리얼 (1) - Map/Reduce WordCount Application 미리보기 08:07
맵리듀스 초급 튜토리얼(2) - Map/Reduce WordCount Application in Python part I 09:56
맵리듀스 초급 튜토리얼(2) - Map/Reduce WordCount Application in Python part II 10:32
맵리듀스 초급 튜토리얼(2) - Map/Reduce WordCount Application in Python part III 09:23
맵리듀스 중급 튜토리얼(3)-Installation and Configuration Eclipse for Hello Word Application in Java part I 12:39
맵리듀스 중급 튜토리얼(3)-Installation and Configuration Eclipse for Hello Word Application in Java part II 06:46
맵리듀스 중급 튜토리얼(3) - WordCount Application for MapReduce in Java using Eclipse part I 08:38
맵리듀스 중급 튜토리얼(3) - WordCount Application for MapReduce in Java using Eclipse part II - 맵리듀스 자바 소스 분석편(1) 10:47
맵리듀스 중급 튜토리얼(3) - WordCount Application for MapReduce in Java using Eclipse part III - 맵리듀스 자바 소스 분석편(2) 28:02
맵리듀스 중급 튜토리얼(3) - WordCount Application for MapReduce in Java using Eclipse part IV - 자바 소스로 맵리듀스 구현하기(1) 05:30
맵리듀스 중급 튜토리얼(4) - WordCount Application for MapReduce in Java using Eclipse part V - 하둡 맵리듀스 구현을 이클립스 플러그인으로 제작해보기 29:56
맵리듀스 고급 튜토리얼(1) - 캐나다 코빅19 2020-20201년 4월 기준 일별로 비교하여 데이터 조회 어플리케이션 제작 part I 10:38
맵리듀스 고급 튜토리얼(1) - 캐나다 코빅19 2020-20201년 4월 기준 일별로 비교하여 데이터 조회 어플리케이션 제작 part II 12:54
맵리듀스 고급 튜토리얼(1) - 캐나다 코빅19 2020-20201년 4월 기준 일별로 비교하여 데이터 조회 어플리케이션 제작 part III 10:00
강의 게시일 : 2021년 05월 27일 (마지막 업데이트일 : 2021년 05월 04일)
수강평 총 14개
수강생분들이 직접 작성하신 수강평입니다. 수강평을 작성 시 300잎이 적립됩니다.
4.6
14개의 수강평
5점
4점
3점
2점
1점
VIEW 좋아요 순 최신 순 높은 평점 순 낮은 평점 순 평점 순 높은 평점 순 낮은 평점 순
eer3v thumbnail
좋은 강의 좋습니다. 다만 강의 앞뒤로 붙은 의미없는 장면이 사운드가 너무 크고 너무 깁니다. 매번 소리땜시 강의듣을때 놀라네요. 그리고 강의 중간에 들리는 배경음도 좀 거슬리는거같아요 이런 부분은 안넣는게 좋을꺼같습니다
2021-10-28
Cho thumbnail
강의 감사합니다. 빅데이터쪽 강의가 나온 것 만으로 크게 만족합니다. 많은 분들이 빅데이터를 하시든 안하시든 한번 들으셨으면 좋겠네요. ^^ 하둡 설치든 Linux에서 환경변수 설정 eclipse설치 및 실행까지 제대로 따라하면 다 됩니다. 그냥 다 떠먹여 주시네요. 강사님 말씀대로 하둡 직접 설치해 본 분들도 cloudera같은 것 쓰셨을 건데 강사님 따라 직접 하둡을 처음부터 설치해보니 좋네요. 몸에 익혀 볼려고 몇 번 되풀이 하면서 따라했습니다. 개인적으로 아쉬웠던 것은 Ubuntu에서 Virualbox 1대에서 설치한 것도 너무 좋았지만, CentOS에서 namenode 1대 + data node 3대 + HA 구성까지 다뤄주셨다면 더 좋았을 뻔 했네요. ㅎㅎ Spark 쪽도 강의 예정은 없으신가요? 하둡 중급강의 기다리고 있겠습니다. 토론토에서 건강하시고 행복하세요~
2021-06-22
지식공유자Billy Lee
네 Cho 님 덕분에 다음 중급 강의를 하지 않을 수 없겠네요. 한 가지 에러를 지적해줄정도로 여러 번을 설치 하셨다니 강의 제작에 보람을 느낍니다. 저도 아쉬운 바로 멀티 노드 셋업 (Multi Node Setup) 곧 클라우드 환경에 맞춘 namenode 1대와 여러 대 data node를 곧 제작하려고 하고 있습니다. 아니 바로 올려 다양한 비전문가들도 하둡을 처음부터 자세히 연결한다면 한국에 하둡 전문가 팀들이 많이지길 바라는 마음도 있습니다. HA 구성까지 한다면 아마 빅데이터 전문가 반열에 올라가게 될 것입니다. 비전문가도 따라 할 수 있을 정도로 자세한 강의로 중급 강의에 좀더 심의를 기울이도록 하겠습니다. 그래도 시간이 필요한 관계로 조금 인내심을 가지고 기다리시면 좋은 강의로 돌아올 것입니다. 다시 한 번 감사합니다. 크게 만족하셨다니 다행입니다.
2021-06-22
Billy Lee thumbnail
이 강의는 빅데이터를 다루는 하둡 전문가로 양성하고 싶은 마음에서 강의를 제작했습니다. 클라우데라와 같은 종합적인 온 프로메스 배포 소프트웨어 어플리케이션(On-Premise Distribution Software: OPD)을 사용하기 보다는 직접 하둡을 처음부터 설치하고 데이터셋을 추출하고 이동 및 로드하는 단계로 여러분을 이동시킬 것입니다. 1.x 버전부터 시작된 하둡은 이제 3.3 버전까지 많은 기능들이 추가되면서 무척 해비한 플랫폼이 되었지만 많은 도구들을 다루며 빅데이터 전문가로 양성되는 마음이 넘치는 강의되기를 바랍니다.
2021-06-18
dylee thumbnail
Intro와 Outro를 제외하고는 유익한 강의였습니다.
2021-11-12
shkimzebra thumbnail
배경음악이 시끄러워서, 강의 듣는데..넘 힘드네요.. ㅠ
2021-11-23

55,000원

폴더에 추가 327 공유
지식공유자 : Billy Lee
총 50개 수업˙총 5시간 56분
평생 무제한 수강
수료증 발급 강의
입문 초급 대상 중급이상
수강 전 궁금한 점이 있나요?
문의하기
문의
지식공유자 되기
많은 사람들에게 배움의 기회를 주고,
경제적 보상을 받아보세요.
지식공유참여
기업 교육을 위한 인프런
“인프런 비즈니스” 를 통해 모든 팀원이 인프런의 강의를
자유롭게 학습하는 환경을 제공하세요.
인프런 비즈니스