站内搜索
数据挖掘工程师 问题列表
问题 在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法。

问题 粒度

问题 假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:()。A、18.3B、22.6C、26.8D、27.9

问题 序列数据没有时间戳。

问题 许多基于内存的聚类算法所常用的两种数据结构是()和()

问题 SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal marginc lassifier)。

问题 试述对于多个异种信息源的集成,为什么许多公司宁愿使用更新驱动的方法(update-driven),而不愿使用查询驱动(query-driven)的方法?

问题 为什么朴素贝叶斯分类称为“朴素”的?简述朴素贝叶斯分类优缺点。

问题 特征提取技术并不依赖于特定的领域。

问题 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。

问题 数据挖掘要解决的问题是什么?

问题 数据仓库数据库常见的存储优化方法包括()、反向规范化引入冗余、表的物理分割。

问题 根据关联分析中所涉及的抽象层,可以将关联规则分类为()。A、布尔关联规则B、单层关联规则C、多维关联规则D、多层关联规则

问题 以下哪些是数据仓库的主要应用?()A、信息处理B、互联网搜索C、分析处理D、数据挖掘

问题 数据挖掘对聚类的典型要求有哪些?