Apache Spark 互动版

在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器

reduce : 规约RDD

使用reduce成员函数对RDD进行规约操作,必须指定一个函数指定规约行为

语法

def reduce(f: (T, T) => T): T

参数 f : 规约函数 , 两个参数分别代表RDD中的两个记录,返回值被RDD用来进行递归计算。

示例

下面的示例使用匿名函数,将所有的记录连接起来构成一个字符串:

scala> textFile.reduce((a,b)=>a+b)
res60:String = #Apache SparkSpake is a fast...

使用RDD的reduce方法进行聚合!

请使用你创建的textFile变量,返回最长的单词。