网友您好, 请在下方输入框内输入要搜索的题目:
题目内容
(请给出正确答案)
关于大数据及应用的描述,不正确的是( )
A.Fume属于Apache的顶级项目,他是一款高性能,高可用的分布式日志手机系统
B.MapRaduce模式的主要思想是自动将一个大的计算(如程序)拆解成Map(映射)和Reduce(化简)
C.Kafka架构分为两层,即生产者(Producer)和消费者(Consumer),他们之间可以直接发送消息
D.与Hadoop相比,Spark的中间数据存放在内存中,对于迭代运算而言,效率更高
B.MapRaduce模式的主要思想是自动将一个大的计算(如程序)拆解成Map(映射)和Reduce(化简)
C.Kafka架构分为两层,即生产者(Producer)和消费者(Consumer),他们之间可以直接发送消息
D.与Hadoop相比,Spark的中间数据存放在内存中,对于迭代运算而言,效率更高
参考答案
参考解析
解析:Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念“Map:(映射)”和“Reduce(归约)”,和它们的主要思想,都是从函数式编程语言里借来的。:它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上,从而实现对'HDFS和HBase上的海量数据分析
Kafka是一种高吞吐量的分布式发布订阅消息系统
Producer
负责发布消息到Kafka broker
Consumer
消息消费者,向Kafka broker读取消息的客户端。
Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab(加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越,换句话说,Spark启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
Spark是在Scala语言中实现的,它将Scala用作其应用程序框架。与Hadoop不同,Spark和Scala能够紧密集成,其中的Scala可以像操作本地集合对象一样轻松地操作分布式数据集。
尽管创建Spark是为了支持分布式数据集上的迭代作业,但是实际上它是对Hadoop的补充,可以在Hadoop文件系统中并行运行。通过名为Mesos的第三方集群框架可以支持此行为。Spark由加州大学伯克利分校AMP实验室(Algorithms,Machines,and People Lab)开发,可用来构建大型的、低延迟的数据分析应用程序。
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念“Map:(映射)”和“Reduce(归约)”,和它们的主要思想,都是从函数式编程语言里借来的。:它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上,从而实现对'HDFS和HBase上的海量数据分析
Kafka是一种高吞吐量的分布式发布订阅消息系统
Producer
负责发布消息到Kafka broker
Consumer
消息消费者,向Kafka broker读取消息的客户端。
Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab(加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
Spark是一种与Hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越,换句话说,Spark启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
Spark是在Scala语言中实现的,它将Scala用作其应用程序框架。与Hadoop不同,Spark和Scala能够紧密集成,其中的Scala可以像操作本地集合对象一样轻松地操作分布式数据集。
尽管创建Spark是为了支持分布式数据集上的迭代作业,但是实际上它是对Hadoop的补充,可以在Hadoop文件系统中并行运行。通过名为Mesos的第三方集群框架可以支持此行为。Spark由加州大学伯克利分校AMP实验室(Algorithms,Machines,and People Lab)开发,可用来构建大型的、低延迟的数据分析应用程序。
更多 “关于大数据及应用的描述,不正确的是( )A.Fume属于Apache的顶级项目,他是一款高性能,高可用的分布式日志手机系统 B.MapRaduce模式的主要思想是自动将一个大的计算(如程序)拆解成Map(映射)和Reduce(化简) C.Kafka架构分为两层,即生产者(Producer)和消费者(Consumer),他们之间可以直接发送消息 D.与Hadoop相比,Spark的中间数据存放在内存中,对于迭代运算而言,效率更高” 相关考题
考题
关于数据库概念设计阶段的工作目标,下列说法错误的是______。A.定义和描述应用系统设计的信息结构和范围B.定义和描述应用系统中数据的属性特征和数据之间的联系C.描述应用系统的数据需求D.描述需要存储的记录及其数量
考题
以下关于数据字典的描述中,不正确的是( )。A.数据字典是系统分析阶段的工具B.数据字典有助于改进分析人员和用户间的通信C.数据字典是应用系统中数据库设计的基础D.数据字典是系统物理模型的一个重要组成部分
考题
( 4 )关于数据库概念设计阶段的工作目标,下列说法错误的是A )定义和描述应用系统涉及的信息结构和范围B )定义和描述应用系统中数据的属性特征和数据之间的联系C )描述应用系统的数据需求D )描述需要存储的记录及其数量
考题
关于大数据的描述,不正确的是()。
A、大数据分析相比传统的数据仓库应用,具有查询及分析简单的特点B、大数据的意义不在于掌握庞大的数据信息,而在于对这些数据进行专业化的处理C、大数据主要依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术D、大数据具有类型繁多、结构化多样、处理速度快、时效性强的特点
考题
关于企业应用集成(EAI)技术,描述不正确的是()A.EAI可以实现表示集成、数据集成、控制集成、应用集成等B.表示集成和数据集成是白盒集成,控制集成是黑盒集成C.EAI技术适用于大多数实施电子商务的企业以及企业之间的应用集成D.在做数据集成之前必须首先对数据进行标识并编成目录
考题
下列关于数据库重构的描述中,不正确的是——一。A.数据库的重构就是对数据库的逻辑结构作必要的小范围改变B.数据库重构包括重新设计数据库及其应用程序C.当存储空间的分配过于零散,导致存取效率下降,所以必须重构数据库D.如果能够重构数据库,尽量不要重新设计数据库及相应的应用程序
考题
关于服务器选型的描述,不正确的是:( )
A.应考虑应用服务器和数据服务器的运算指标和性能
B.在关键业务应用中数据库和应用服务器应支持群集和高可用性处理
C.服务器的处理能力只需满足关键业务应用和当前用户规模的需求
D.服务器的硬盘、网络接口、网络连接及电源均应考虑足够的冗余
考题
关于数据库管理优势的描述中,不正确的是( )。A.存储数据大,但建立、修改等复杂操作均需专业人员操作
B.数据共享好,冗余少,能够存储海量信息
C.数据统计检索又快又准,降低了数据库的使用成本
D.数据维护简便、易行
考题
下列哪项是数据字典所包含的内容的最准确描述?A.关于数据库中数据项目及它们的含义的有组织的描述
B.应用程序所使用的记录显示格式的描述
C.管理数据库用户优先权和安全规则的描述
D.数据库中记录更新之前和之后的映象
考题
以下关于数据模型描述不正确的是()。A、数据模型表示的是数据库本身B、数据模型是客观事物及其联系的描述C、数据模型能以一定结构形式表示出各种不同数据及数据间的关系D、数据模型是对现实世界的抽象
考题
下列关于管理信息系统综合结构的描述不正确的是()A、可以做到数据的完全集中统一B、各功能子系统都有自己的专用数据库和应用程序C、不同层次的信息处理分别由不同功能子系统实现D、各功能子系统可以共享公用数据库的数据,并调用公用的应用程序和模型
考题
关于OLAP和OLTP的区别描述,不正确的是()A、OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务C、OLAP的特点在于事务量大,但事务内容比较简单且重复率高D、OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统
考题
Google云计算应用场景的特点,以下描述不正确的是()。A、Google的所有应用都是远程应用,而不是本地应用。B、Google本身应用软件的功能在云端。C、Google存储数据在云端。D、Google计算在终端。
考题
单选题以下关于数据模型描述不正确的是()。A
数据模型表示的是数据库本身B
数据模型是客观事物及其联系的描述C
数据模型能以一定结构形式表示出各种不同数据及数据间的关系D
数据模型是对现实世界的抽象
考题
单选题关于OLAP和OLTP的区别描述,不正确的是()A
OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B
与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务C
OLAP的特点在于事务量大,但事务内容比较简单且重复率高D
OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统
考题
单选题采用文件系统方式管理数据的特点描述不正确的是()。A
数据联系弱B
数据冗余大C
数据不共享D
数据联系强可共享
热门标签
最新试卷