当前位置：极客笔记 > Spark > Spark 精选教程 > Spark Distinct函数

Spark Distinct函数

Spark Distinct函数

在Spark中，Distinct函数从提供的数据集返回不同的元素。

Distinct函数的示例

在此示例中，我们忽略了重复的元素，只检索出不同的元素。

要在Scala模式下打开Spark，请按照以下命令操作。

$ spark-shell

Spark Distinct函数

使用并行化集合创建一个RDD。

scala> val data = sc.parallelize(List(10,20,20,40))

现在，我们可以使用以下命令来阅读生成的结果。

scala> data.collect

Spark Distinct函数

将distinct()函数应用于忽略重复元素。

scala> val distinctfunc = data.distinct()

现在我们可以使用以下命令读取生成的结果。

scala> distinctfunc.collect

Spark Distinct函数

在这里，我们得到了期望的输出。

Camera课程

Camera API2 教程

API2 教程

Camera 性能教程

Perf 教程

Camera Native Framework 教程

Native FW 教程

Camera QCOM ISP 教程

ISP 教程

Camera QCOM Sensor 教程

Sensor 教程

Python教程

Python 教程

Python 教程

NumPy 教程

NumPy 教程

Django 教程

Django 教程

Java教程

Java 教程

Java 教程

Web教程

JavaScript 教程

JavaScript 教程

jQuery 教程

jQuery 教程

CSS 教程

CSS 教程

PHP 教程

PHP 教程

Laravel 教程

Laravel 教程

TypeScript 教程

TypeScript 教程

WordPress 教程

WordPress 教程

数据库教程

SQL 教程

SQL 教程

SQLite 教程

SQLite 教程

MySQL 教程

MySQL 教程

PL/SQL 教程

PL/SQL 教程

MongoDB 教程

MongoDB 教程

图形图像教程

OpenCV 教程

OpenCV 教程

办公软件教程

Excel 教程

Excel 教程

Linux教程

Linux命令全集

Linux命令全集

Linux内核API

Linux内核API

LVGL 教程

LVGL 教程

计算机教程

操作系统教程

操作系统教程

计算机网络教程

计算机网络教程

C语言教程

C语言教程

C++ 教程

C++ 教程

Swift 教程

Swift 教程

大数据教程

Hadoop 教程

Hadoop 教程

Spark 教程

Spark 教程

Scala 教程

Scala 教程

开发工具教程

Git 教程

Git 教程

Jenkins 教程

Jenkins 教程

ChatGPT 教程

ChatGPT 教程

IntelliJ 教程

IntelliJ 教程

回顶
回顶部