考题
Spark在同一个应用中不能同时使用SparkSQL和Mllib。()
此题为判断题(对,错)。
考题
SparkSQL可以通过()方法加载json文件为DataFrame。
A.readB.jsonC.getD.at
考题
下面哪个不属于apachespark的组件()
A.GraphX(graph)B.MLlib(machinelearning)C.MapD.SparkSQL
考题
SparkSQL可以处理()。
A.RDDB.Parquet文件C.JSON文件D.Hive表
考题
SparkSQL可以通过()方法将HDFS上的格式化文件转换为DataFrame。
考题
艾滋病的英文缩写是A.ARDSB.AIDSC.HBVD.HIVE.HAV
考题
艾滋病的英文缩写是A、ARDS
B、AIDS
C、HBV
D、HIV
E、HAV
考题
通过性接触传播的RNA病毒是A.HAVB.HSVC.HCMVD.HIVE.HPV
考题
SparkSQL的应运而生,它是将SparkSQL转换成RDD,然后提交到集群执行,执行效率非常快
考题
SparkSQL编程中需要如下那些资源或者类的引用()A、sql风格B、DSL风格C、RDD风格D、mybatis风格
考题
sparkSql仅仅支持查询原生的RDD,其他方式的查询都不支持
考题
hive是shark的前身,shark是sparkSql的前身
考题
SparkStreaming中的Dstream和SparkSql中的DataFrame其实是一回事,没有区别
考题
sparkSql可以访问hive数据,并将其结果取回作为RDD使用
考题
sparkSql不能使用jdbc读取数据库的数据
考题
Hive?是建立在Hadoop?之上的,所有?Hive?的数据都是存储在HDFS?中的
考题
Hive架构建立在Hadoop之上的,所有Hive中数据都是存储在HDFS中
考题
SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用
考题
SparkSQL有如下优点()A、最基本也是最常用的单元B、都是通过new出来的C、其实例保存在spring容器中D、在spring技术中是基于组件的
考题
SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD
考题
Hive和sql对比下列正确的是?()A、Hive不支持索引B、sql不支持数据更新C、Hive扩展性好D、sql执行延迟高