网友您好, 请在下方输入框内输入要搜索的题目:

题目内容 (请给出正确答案)

以下关于rdd的说法中,正确的是哪些()

  • A、rdd是由一系列partition够成的
  • B、rdd之间都是独立的,没有依赖
  • C、算子作用在partition上
  • D、每个rdd都会提供一批最优的计算位置

参考答案

更多 “以下关于rdd的说法中,正确的是哪些()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置” 相关考题
考题 SparkStreming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。 A.transB.reduceC.joinD.cogroup

考题 GraphX中()是完整提供边的各种操作类。 A.VertexRDDB.RDD[VertexId,VD]C.RDD[Edge]D.EdgeRDD

考题 GraphX中()是存放着Edg对象的RDD。 A.VertexRDDB.RDD[VertexId,VD]C.RDD[Edge]D.EdgeRDD

考题 groupByKey算子在一个(K,V)的RDD上调用,返回一个(K,Iterator[V])的RDD

考题 以下属于spark启动后进程的是()A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 mapPartitions算子类似于map,但独立地在RDD的每一个分片上运行,因此在类型为T的RDD上运行时,func的函数类型必须是Iterator[T]=Iterator[U]

考题 count算子返回RDD的元素个数

考题 interSection算子对源RDD和参数RDD求交集后返回一个新的RDD

考题 map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成

考题 union算子对源RDD和参数RDD求并集后返回一个新的RDD

考题 spark在进行数据切分的时候,决定了partition的哪些属性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

考题 以下关于rdd的特性说法错误的是()A、rdd是仅仅由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 以下选项属于rdd特性的是()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

考题 spring中关于bean的说法正确的是()A、rdd是由一组partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 Spark中,以下哪些是rdd的特性()A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

考题 DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据

考题 以下选项中是persist算子在源码中具有哪些参数的是()A、rdd是由一系列partition够成的B、rdd之间都是独立的,没有依赖C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

考题 sortByKey算子在一个(K,V)的RDD上调用,K必须实现Ordered接口,返回一个按照key进行排序的(K,V)的RDD

考题 RDD特性包含如下哪些?()A、一组分片(Partition),即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表,存储存取每个Partition的优先位置(preferredlocation)

考题 cogroup算子在类型为(K,V)和(K,W)的RDD上调用,返回一个(K,(Iterable,Iterable))类型的RDD

考题 RDD中的所有转换都是通过转化算子延迟加载的,也就是说,它们并不会直接计算结果

考题 filter算子返回一个新的RDD,该RDD由经过函数计算后返回值为true的输入元素组成

考题 distinct算子对源RDD进行去重后返回一个新的RDD

考题 以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

考题 多选题关于spark说法正确的是()。A调用RDD的Transformation算子可以立即发起jobBNodeManager负责整个集群的资源统一调度和分配。CYarn-client适合测试,Yarn-cluster适合生产。DDataset具有RDD和DataFrame的优点,又避免它们的缺点。

考题 判断题RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。A 对B 错

考题 ( 难度:中等)关于spark中RDD说法错误的是:A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的C.宽依赖中会有shuffle的产生D.窄依赖中会有shuffle的产生