站内搜索
大数据智能办公系统知识 问题列表
问题 对于以下2个列表的操作,下面那些说法说法正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(4,5,1,2,3,)

问题 以下算子属于执行算子的是()A、mapB、foreachC、flatmapD、join

问题 在scala中Int类型是几个字节()A、1B、2C、3D、4

问题 dataFrame和RDD类似,也是一个分布式数据容器

问题 Scala异常处理:()A、Case匹配的方式处理B、Throw出去C、抛插值器D、singleton=false

问题 关于java集合说法,哪几个是正确的()A、List集合中数据可以重复B、Set集合中数据可以重复C、Map集合是键值对的形式存储的数据D、Set集合和List集合没有区别

问题 driver的作用包括和worker建立相应的连接

问题 Spark是在Scala语言中实现的,它将Scala用作其应用程序框架

问题 下列语句中编译报错的是()A、vara=0;a=20B、vala=0;a=20C、varb=0;if(b0){}D、varb=0;if(b){}

问题 RDD允许用户在执行多个查询时显式地将工作集缓存在内存中,后续的查询能够重用工作集,这极大地提升了查询速度

问题 hdfs是一个基于内存的计算模型

问题 spark中管理本机资源的节点是worker

问题 内存计算下,Spark?比?Hadoop?快10倍

问题 下列关于scala中的object描述正确的是()A、object是scala的关键字B、scala中的object和java中的object是一样的C、object本身就是一个单例对象D、scala中的object是一个伴生对象

问题 spark生态圈不能进行实时计算