当前位置：极客笔记 > Spark > Spark 精选教程 > Spark 组件

Spark 组件

Spark 组件

Spark项目由不同类型的紧密集成的组件组成。在其核心，Spark是一个计算引擎，可以调度，分发和监视多个应用程序。

让我们详细了解每个Spark组件。

Spark 组件

Spark Core

Spark Core 是Spark的核心，执行核心功能。
它包含任务调度、故障恢复、与存储系统和内存管理交互的组件。

Spark SQL

Spark SQL 建立在Spark Core之上，提供对结构化数据的支持。
它允许通过SQL（结构化查询语言）以及Apache Hive的SQL变体（称为HQL）来查询数据。
它支持建立Java对象和现有数据库、数据仓库和商业智能工具之间的JDBC和ODBC连接。
它还支持来自Hive表、Parquet和JSON等各种数据源。

Spark Streaming

Spark Streaming 是Spark的一个组件，支持可伸缩和容错处理流式数据。
它利用Spark Core 的快速调度能力执行流式分析。
它接受小批量数据并对其执行RDD转换。
其设计确保用于流式数据的应用程序可以通过少量修改来重用以分析历史数据批处理。
Web服务器生成的日志文件可以被视为数据流的实时示例。

MLlib

MLlib是一个包含各种机器学习算法的机器学习库。
其中包括相关性和假设测试、分类和回归、聚类和主成分分析。
它比Apache Mahout使用的基于磁盘的实现快9倍。

GraphX

GraphX是一个用于操作图并执行图并行计算的库。
它便于创建具有任意属性的有向图，每个顶点和边都可以附加属性。
为了操纵图，它支持各种基本操作符，如子图、连接顶点和聚合消息。

Camera课程

Camera API2 教程

API2 教程

Camera 性能教程

Perf 教程

Camera Native Framework 教程

Native FW 教程

Camera QCOM ISP 教程

ISP 教程

Camera QCOM Sensor 教程

Sensor 教程

Python教程

Python 教程

Python 教程

NumPy 教程

NumPy 教程

Django 教程

Django 教程

Java教程

Java 教程

Java 教程

Web教程

JavaScript 教程

JavaScript 教程

jQuery 教程

jQuery 教程

CSS 教程

CSS 教程

PHP 教程

PHP 教程

Laravel 教程

Laravel 教程

TypeScript 教程

TypeScript 教程

WordPress 教程

WordPress 教程

数据库教程

SQL 教程

SQL 教程

SQLite 教程

SQLite 教程

MySQL 教程

MySQL 教程

PL/SQL 教程

PL/SQL 教程

MongoDB 教程

MongoDB 教程

图形图像教程

OpenCV 教程

OpenCV 教程

办公软件教程

Excel 教程

Excel 教程

Linux教程

Linux命令全集

Linux命令全集

Linux内核API

Linux内核API

LVGL 教程

LVGL 教程

计算机教程

操作系统教程

操作系统教程

计算机网络教程

计算机网络教程

C语言教程

C语言教程

C++ 教程

C++ 教程

Swift 教程

Swift 教程

大数据教程

Hadoop 教程

Hadoop 教程

Spark 教程

Spark 教程

Scala 教程

Scala 教程

开发工具教程

Git 教程

Git 教程

Jenkins 教程

Jenkins 教程

ChatGPT 教程

ChatGPT 教程

IntelliJ 教程

IntelliJ 教程

Spark 精选教程

回顶
回顶部