Apache Spark 互动版

在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器

take:无序采样

使用take成员函数获得指定数量的记录,返回一个数组。与top不同,take在提取记录 前不进行排序,它仅仅逐分区地提取够指定数量的记录就返回结果。可以将take方法 视为对RDD对象的无序采样。

语法

def take(num: Int): Array[T]

参数 num : Int , 要获取的记录数量

返回值

包含指定数量记录的数组,记录类型为T。

示例

下面的示例返回文件中的两行(两个成员):

scala> textFile.take(2)
res1: Array[String] = Array(# Apache Spark,"")

使用RDD的take方法获得指定数量的记录。

请使用你创建的textFile变量,读取两行,存入变量 take2 中。