网友您好, 请在下方输入框内输入要搜索的题目:
题目内容
(请给出正确答案)
在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么()
- A、违反了建模的假设条件
- B、加大了处理的难度
- C、无法针对分区后各个数据集的特征分别做数据清洗
- D、无法对不同数据清理的方法进行比较,以选择最优方法
参考答案
更多 “在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么()A、违反了建模的假设条件B、加大了处理的难度C、无法针对分区后各个数据集的特征分别做数据清洗D、无法对不同数据清理的方法进行比较,以选择最优方法” 相关考题
考题
若处理调查数据时发现有缺失数据,且样本量很大,有缺失数据的个案比例较小,有缺失数据的个案与无缺失数据的个案在分布上无显著差异时,可以( )。
A. 将有缺失的个案整个删除B. 将有缺失的个案保留,仅在计算时删除相应变量的缺失值C. 使用均值代替、回归估计、随机抽取、最近距离确定等方法代替缺失值D. 通过对调查中的回答数据使用加权因子,对数据进行调整,减少缺失值的影响
考题
对于脱落/缺失数据的应对,以下说法错误的是()。
A、在方案或者SAP中提前考虑缺失数据的处理B、医学监查,数据审核,统计师参与判断受试者,能否进入最终的分析集C、在统计分析时候,根据缺失数据的缺失机制,考虑数据的填补规则D、基于原方案的设计,揭盲后评价追加样本量
考题
获取数据后,为顺利分析数据,需要先进行数据清洗。数据清洗工作一般不包括( )。A. 筛选清除多余重复的数据B. 将缺失的数据补充完整C. 估计合理值修改异常数据D. 纠正或删除错误的数据
考题
断路器中,对于不带温度补偿的SF6密度继电器(压力表),应对照制造厂提供的温度-压力曲线,与()环境温度下的()进行比较分析(A)不同,之前数据 (B)不同,当前数据 (C)相同,之前数据 (D)相同,历史数据
考题
断路器中,对于不带温度补偿的SF6密度继电器(压力表),应对照制造厂提供的温度-压力曲线,与( )环境温度下的( )进行比较分析。不同,之前数据$; $不同,当前数据$; $相同,之前数据$; $相同,历史数据
考题
在对回收后的调查问卷进行数据处理时,处理缺失值的办法主要是()。A、用一个样本统计量的值代替缺失值B、用从一个统计模型计算出来的值去代替缺失值C、将有缺失值的个案删除D、将有缺失值的个案保留,仅在相应的分析中做必要的删除
考题
当一个连续变量的缺失值占比在85%左右时,以下哪种方式最合理()A、直接使用该变量B、根据是否缺失,生成指示变量,仅使用指示变量作为解释变量C、使用多重插补的方法进行缺失值填补D、直接删除该变量
考题
在进行杀毒时应注意的事项不包括().A、在对系统进行杀毒之前,先备份重要的数据文件B、在对系统进行杀毒之前,先断开所有的I/O设备C、在对系统进行杀毒之前,先断开网络D、杀完毒后,应及时打补丁
考题
()是在分区中使用范围分区分区数据,而在子分区中使用散列分区方法,它适合于历史数据和条块数据,改善范围分区及其数据放置的管理性,提供了散列分区的并行机制优点。A、列表分区B、组合分区C、交叉分区D、时间分区
考题
单选题你的SQL Server 2005数据库包含一个有500,000,000行数据的表。其中,一些是历史数据,一些是当前的数据。你需要在一个服务器上对数据进行分区,以提高性能和优化管理。你应该怎么做?()A
进行水平分区B
进行垂直分区C
进行原始分区(raw partition)D
进行分布式分区(distributed partitioning)
考题
多选题在对回收后的调查问卷进行数据处理时,处理缺失值的办法主要是()。A用一个样本统计量的值代替缺失值B用从一个统计模型计算出来的值去代替缺失值C将有缺失值的个案删除D将有缺失值的个案保留,仅在相应的分析中做必要的删除
考题
单选题在进行杀毒时应注意的事项不包括().A
在对系统进行杀毒之前,先备份重要的数据文件B
在对系统进行杀毒之前,先断开所有的I/O设备C
在对系统进行杀毒之前,先断开网络D
杀完毒后,应及时打补丁
考题
单选题在对历史数据集进行分区之前进行数据清洗(缺失值填补等)的缺点是什么()A
违反了建模的假设条件B
加大了处理的难度C
无法针对分区后各个数据集的特征分别做数据清洗D
无法对不同数据清理的方法进行比较,以选择最优方法
热门标签
最新试卷
![瑞牛题库 章节练习 历年真题 模拟试卷](http://assets.51tk.com/51_sidebar_right_index.jpg)