大数据智能办公系统知识

问题对于以下2个列表的操作，下面那些说法说法正确vart=List（1，2，3）vart2=List（4，5）（）A、vart3=t++t2得到List（1，2，3，4，5）B、vart3=List.concat（t，t2）得到List（1，2，3，4，5）C、vart3=t：：：t2得到List（1，2，3，4，5）D、vart3=t.：：：（t2）得到List（4，5，1，2，3，）

查看答案

问题以下算子属于执行算子的是（）A、mapB、foreachC、flatmapD、join

查看答案

问题在scala中Int类型是几个字节（）A、1B、2C、3D、4

查看答案

问题 dataFrame和RDD类似，也是一个分布式数据容器

查看答案

问题 Scala异常处理：（）A、Case匹配的方式处理B、Throw出去C、抛插值器D、singleton=false

查看答案

问题关于java集合说法，哪几个是正确的（）A、List集合中数据可以重复B、Set集合中数据可以重复C、Map集合是键值对的形式存储的数据D、Set集合和List集合没有区别

查看答案

问题 driver的作用包括和worker建立相应的连接

查看答案

问题 Spark是在Scala语言中实现的，它将Scala用作其应用程序框架

查看答案

问题下列语句中编译报错的是（）A、vara=0；a=20B、vala=0；a=20C、varb=0；if（b0）{}D、varb=0；if（b）{}

查看答案

问题 RDD允许用户在执行多个查询时显式地将工作集缓存在内存中，后续的查询能够重用工作集，这极大地提升了查询速度

查看答案

问题 hdfs是一个基于内存的计算模型

查看答案

问题 spark中管理本机资源的节点是worker

查看答案

问题内存计算下，Spark？比？Hadoop？快10倍

查看答案

问题下列关于scala中的object描述正确的是（）A、object是scala的关键字B、scala中的object和java中的object是一样的C、object本身就是一个单例对象D、scala中的object是一个伴生对象

查看答案

问题 spark生态圈不能进行实时计算

查看答案