网友您好, 请在下方输入框内输入要搜索的题目:
题目内容
(请给出正确答案)
spark中的rdd是一个()数据集
- A、弹性分布式
- B、弹性计算
- C、运送数据
- D、心跳
参考答案
更多 “spark中的rdd是一个()数据集A、弹性分布式B、弹性计算C、运送数据D、心跳” 相关考题
考题
以下关于sparkstreaming说法正确的是()A、spark streaming分布式微批架构B、spark streaming实时存储架构C、spark streaming是普通存储架构D、spark streaming分布式实时计算架构
考题
spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
考题
RDD特性包含如下哪些?()A、一组分片(Partition),即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表,存储存取每个Partition的优先位置(preferredlocation)
考题
单选题下列有关RDD的说法中错误的是()。A
RDD是一个只读的,可分区的分布式数据集。B
RDD默认存储在磁盘,当磁盘不足时,溢写到内存。C
RDD数据以分区的形式在集群中存储。D
RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。
考题
问答题描述Spark集群计算中RDD的含义和作用。
热门标签
最新试卷