take:无序采样
使用take成员函数获得指定数量的记录,返回一个数组。与top不同,take在提取记录 前不进行排序,它仅仅逐分区地提取够指定数量的记录就返回结果。可以将take方法 视为对RDD对象的无序采样。
语法
def take(num: Int): Array[T]
参数 num : Int , 要获取的记录数量
返回值
包含指定数量记录的数组,记录类型为T。
示例
下面的示例返回文件中的两行(两个成员):
scala> textFile.take(2) res1: Array[String] = Array(# Apache Spark,"")
使用RDD的take方法获得指定数量的记录。
请使用你创建的textFile变量,读取两行,存入变量 take2 中。