Apache Spark 互动版

在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器

collect : 收集全部记录

使用collect成员函数获得RDD中的所有记录,返回一个数组。collect方法 可以视为对RDD对象的一个全采样

语法

def collect(): Array[T]

示例

下面的示例返回RDD中的所有记录:

scala> textFile.collect()
res10: Array[String] = Array(# Apache Spark, "", Spark is a fast ...)    

使用RDD的collect方法获得全部记录!

请使用你创建的textFile变量,读取全部行,并存入变量 Lines 中。