Apache Spark 互动版

在线工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器

map : 映射

映射变换使用一个映射函数对RDD中的每个记录进行变换,每个记录变换后的新值集合构成一个新的RDD。

语法

def map[U](f: (T) => U)(implicit arg0: ClassTag[U]): RDD[U]

参数

  • f : 映射函数 , 输入参数为原RDD中的一个记录,返回值构成新RDD中的一个记录。

示例

下面的示例将textFile的每个记录(字符串)变换为其长度值,获得一个新的RDD,然后取回第一个记录查看:

scala> textFile.map(line=>line.length).first()
res13:Int = 14

使用RDD的map方法构造一个逐记录变换的新RDD!

请使用你创建的textFile变量,计算全部的单词数量。