강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

신진님의 프로필 이미지
신진

작성한 질문수

IT 회사에서 비개발자가 살아남기 위한 모든 개발 지식 A to Z

데이터 파이프라인(데이터의 전체 흐름) 파악하기

데이터 파이프라인과 구글

작성

·

74

1

삭제된 글입니다

답변 1

0

그랩님의 프로필 이미지
그랩
지식공유자

1번, 수집된 데이터들을 가공하기 위해서 사용하는 프로그램입니다! 보통 아파치 스파크는 대용량 데이터를 빠르게 가공하는 상황에서 자주 사용됩니다!

2번, 데이터 수집, 가공 서버들은 Javascript 환경으로 만들면 Node.js를 사용하게 되겠죠? 그러나 보통 Java나 다른 프로그래밍 언어로 서버를 구축합니다 (이또한 직접 구축하기보단 이미 개발된 서버를 사용하는 편입니다)

3번, 말씀하신 부분이 맞습니다. 구글의 저장소에는 웹 페이지 URL과 간략한 텍스트를 특정 형태로 저장시켜 놓고 검색을 했을 때 해당 URL과 텍스트를 찾아서 반환하는 방식입니다.

신진님의 프로필 이미지
신진

작성한 질문수

질문하기