网友您好, 请在下方输入框内输入要搜索的题目:

题目内容 (请给出正确答案)

groupByKey算子在一个(K,V)的RDD上调用,返回一个(K,Iterator[V])的RDD


参考答案

更多 “groupByKey算子在一个(K,V)的RDD上调用,返回一个(K,Iterator[V])的RDD” 相关考题
考题 在一个被调用函数中,关于return 语句使用的描述,( )是错误的. A、被调用函数中可以不用return语句B、被调用函数中可以使用多个return语句C、被调用函数中,如果有返回值,就一定要有return语句D、被调用函数中,一个return语句可返回多个值给调用函数

考题 RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器数组、列表等中的所有元素构成新的RDD。() 此题为判断题(对,错)。

考题 SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。 A.transB.reduceC.joinD.cogroup

考题 SparkStreming中()函数当被调用的两个DStream分别含有K,V和K,W键值对时,返回一个K,Seq[V],Seq[W]类型的新的DStream。 A.unionB.reduceC.joinD.cogroup

考题 SparkStreming中()函数当被调用类型分别为(K,V)和(K,W)键值对的2个DStream时,返回类型为(K,(V,W))键值对的一个新DStream。 A.unionB.reduceC.joinD.cogroup

考题 reduceByKey算子在一个(K,V)的RDD上调用,返回一个(K,V)的RDD,使用指定的reduce函数,将相同key的值聚合到一起

考题 take算子返回一个由数据集的前n个元素组成的数组

考题 mapPartitions算子类似于map,但独立地在RDD的每一个分片上运行,因此在类型为T的RDD上运行时,func的函数类型必须是Iterator[T]=Iterator[U]

考题 count算子返回RDD的元素个数

考题 interSection算子对源RDD和参数RDD求交集后返回一个新的RDD

考题 map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成

考题 union算子对源RDD和参数RDD求并集后返回一个新的RDD

考题 以下关于rdd的特性说法错误的是()A、rdd是仅仅由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 以下关于rdd的说法中,正确的是哪些()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 join算子在类型为(K,V)和(K,W)的RDD上调用,返回一个相同key对应的所有元素对在一起的(K,(V,W))的RDD

考题 spring中关于bean的说法正确的是()A、rdd是由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 以下选项中是persist算子在源码中具有哪些参数的是()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 sortByKey算子在一个(K,V)的RDD上调用,K必须实现Ordered接口,返回一个按照key进行排序的(K,V)的RDD

考题 以下哪些是rdd的特性()A、cache算子是persist算子的一个子集B、persist算子是cache算子的一个子集C、persist算子包含cache算子D、cache算子包含persist算子

考题 countByKey为针对(K,V)类型的RDD,返回一个(K,Int)的map,表示每一个key对应的元素个数

考题 cogroup算子在类型为(K,V)和(K,W)的RDD上调用,返回一个(K,(Iterable,Iterable))类型的RDD

考题 filter算子返回一个新的RDD,该RDD由经过函数计算后返回值为true的输入元素组成

考题 distinct算子对源RDD进行去重后返回一个新的RDD

考题 关于同步调用和异步调用,下面说法不正确的是()A、如果执行一个同步调用动作,该动作执行将被阻塞,直到收到来自被调用行为的一个应答B、如果执行一个异步调用动作,只要被调用行为启动了,该调用动作就完成了C、一个同步调用动作可得到被调用行为返回的计算结果D、一个异步调用动作也可得到被调用行为返回的计算结果

考题 判断题RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。A 对B 错

考题 单选题函数和过程的区别为()。A 函数执行后返回一个值,而过程不需返回值B 过程执行后返回一个值,而函数不需返回值C 过程在被调用时,能执行某种特殊功能并能返回到调用它的地方D 函数在被调用时,能执行某种特殊功能并能返回到调用它的地方

考题 多选题关于spark说法正确的是()。A调用RDD的Transformation算子可以立即发起jobBNodeManager负责整个集群的资源统一调度和分配。CYarn-client适合测试,Yarn-cluster适合生产。DDataset具有RDD和DataFrame的优点,又避免它们的缺点。