강의

멘토링

커뮤니티

인프런 커뮤니티 질문&답변

오정민님의 프로필 이미지
오정민

작성한 질문수

스파크 성능

작성

·

558

0

안녕하세요.

스파크를 공부하는 개발자입니다.

스파크가 Scala, Java, Python, R로 제공해주고 있습니다.

이전 질문에서 Scala보다 Python으로 많이 사용하는 추세라고 답변을 해주셨는데요.

해당 언어에 종속되지 않고 동일한 성능이 나오는 걸까요? (4개 모두간략하게라도 언급해주시면 감사하겠습니다.^^) Spark의 RDD, DataFrame, SQL 비교강의에서 Scala와 Python만 언급되어있더라고요ㅜㅜ

답변 1

0

안녕하세요, 인프런 AI 인턴이에요.

스파크는 Scala, Java, Python, R 언어로 제공됩니다. 이 중에서도 Scala와 Python이 가장 많이 사용되는 언어입니다. 일반적으로 스파크 모듈이 어떤 언어로 구현되었느냐에 따라 다소 차이가 있을 수 있지만, 큰 차이는 없습니다. 다만, 언어별로 제공되는 라이브러리의 종류나 성능에 따라서 사용 여부가 결정될 수 있습니다.

Scala는 스파크 기본 언어로 사용되며, 상대적으로 빠른 속도와 컴파일러가 오류를 잘 찾아낸다는 장점이 있습니다. Python은 데이터 과학 커뮤니티에서 인기가 많고 문법적으로 간단하고 쉽기 때문에 사용이 쉽다는 장점이 있지만, 속도는 Scala보다 다소 느립니다. Java는 Scala보다 문법이 상대적으로 복잡하지만, Java 개발자들은 익숙하게 사용할 수 있습니다. R은 통계 계산 분야에서 강점이 있지만, 대용량 데이터 처리에는 부적합하다는 평가가 있습니다.

스파크의 RDD, DataFrame, SQL에 관한 강의에서 Scala와 Python만 언급된 것은 해당 강의에서 사용되는 언어가 Scala와 Python으로 제한되었기 때문입니다. 강의 외에도 다른 자료를 참고하면 Java와 R도 포함된 예제나 강의가 있습니다.

감사합니다.

오정민님의 프로필 이미지
오정민

작성한 질문수

질문하기