网友您好, 请在下方输入框内输入要搜索的题目:

题目内容 (请给出正确答案)

我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()

A.我们随机抽取一些样本,在这些少量样本之上训练

B.我们可以试用在线机器学习算法

C.我们应用PCA算法降维,减少特征数

D.B和C

E.A和B

F.以上所有


参考答案

更多 “ 我们建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练()A.我们随机抽取一些样本,在这些少量样本之上训练B.我们可以试用在线机器学习算法C.我们应用PCA算法降维,减少特征数D.B和CE.A和BF.以上所有 ” 相关考题
考题 我们想要减少数据集中的特征数,即降维.选择以下适合的方案()1.使用前向特征选择方法2.使用后向特征排除方法3.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.4.查看相关性表,去除相关性最高的一些特征A.1和2B.2,3和4C.1,2和4D.All

考题 我们想要减少数据集中的特征数,即降维.选择以下适合的方案:( ) A.使用前向特征选择方法B.使用后向特征排除方法C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征.D.查看相关性表,去除相关性最高的一些特征

考题 数据是我们要处理的(),数据模型是数据的()。

考题 机器学习和数据科学间是存在交集的。例如,逻辑回归可以用来研究关系,也可以用来做预测。我们可以将数据科学和机器学习想象成一个“谱”,较容易解释的模型更靠近数据科学一侧,“黑箱”模型则更靠近机器学习一侧。

考题 当一个较为复杂的机器学习模型对于训练数据集杰出表现,而对于验证或是实际数据表现较差,此类现象我们称之为()。通过代表性不足的数据训练出来的机器模型对于验证或是实际数据表现较差,我们称这种现象为()。

考题 97、在拿到一个具体的大数据问题之后,在建立解决问题的模型前,我们首先一般应该做哪些工作A.概览数据,了解问题背景B.清洗数据C.调整模型参数D.特征的构造与筛选

考题 1、海浪数值模拟数据一般不能作为机器学习模型的训练数据。

考题 4、机器学习和数据科学间是存在交集的。例如,逻辑回归可以用来研究关系,也可以用来做预测。我们可以将数据科学和机器学习想象成一个“谱”,较容易解释的模型更靠近数据科学一侧,“黑箱”模型则更靠近机器学习一侧。

考题 我们要用概率模型对数据和标签进行学习,需要数据/标签对服从某种概率分布,称为 。