站内搜索
大数据智能办公系统知识 问题列表
问题 spark的组件不包含哪个()A、spark coreB、hdfsC、GraphxD、spark streaming

问题 日志收集系统Flume现在使用的是哪个版本?()A、NG版本B、OG版本C、DG版本D、MG版本

问题 sparkSql是基于hive的

问题 spark本身自带读取hdfs数据的方法

问题 分区是kafka消息队列的最小单位

问题 下面哪个操作是窄依赖()A、reducebykeyB、filterC、groupD、reduce

问题 SparkSQL有如下优点()A、最基本也是最常用的单元B、都是通过new出来的C、其实例保存在spring容器中D、在spring技术中是基于组件的

问题 scala中val定义的变量,赋值后不能改变

问题 Set集合是无序不重复的集合

问题 spark架构在整个计算过程中,其partition个数是不可变的

问题 通过如下程序块可以知道其输出结果为varlist=List(1,2,99,4,100)varjs=list.reduceRight(_min_)println(js)()A、100B、1C、206D、以上答案都不对

问题 在spark中一个application实质就是一个spark程序

问题 collect算子在驱动程序中,以数组的形式返回数据集的所有元素,要谨慎使用

问题 跟在类名后面的是主构造器

问题 以下选项哪些不是hive表存储结构?()A、内表存储B、外表存储C、混合存储D、内存存储