首页 > 学历类考试

题目内容（请给出正确答案）

[多选题]

我们想要训练一个ML模型，样本数量有100万个，特征维度是5000，面对如此大数据，如何有效地训练模型（）。

A.对训练集随机采样，在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“我们想要训练一个ML模型，样本数量有100万个，特征维度是5…”相关的问题

第1题

用决策树训练一个分类器模型，树的每个叶子结点代表了（）信息。

A.样本数量

B.无实际意义

C.分类标签

D.变量数量

点击查看答案

第2题

我们想要减少数据集中的特征数，即降维.选择以下适合的方案：（）。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用，去训练一个模型，得到测试集上的表现.然后我们去掉一个特征，再去训练，用交叉验证看看测试集上的表现.如果表现比原来还要好，我们可以去除这个特征

D.查看相关性表，去除相关性最高的一些特征

点击查看答案

第3题

随机森林利用随机的方式将许多决策树组合成一个森林，每个决策树在分类的时候决定测试样本的最终类别。它的优点是（)。

A.级别划分较多的属性不会影响模型效果

B.在某些噪音较大的分类或回归问题上不会过拟合

C.每次学习使用不同训练集，一定程度避免过拟合

D.能够处理高纬度的数据，并且不做特征选择

点击查看答案

第4题

机器学习模型训练时出现过拟合的表现是训练样本误差减小，而测试样本误差增大。（)

点击查看答案

第5题

以下哪些是可能导致模型过拟合的原因（)。

A.模型学习到了样本的一般性质

B.学习迭代次数过多

C.训练集数量级和模型复杂度不匹配，训练集的数量级小于模型的复杂度

D.训练集和测试集特征分布不一致

点击查看答案

第6题

去噪自编码器可以利用含缺失值的样本进行训练，训练出可以用于填补缺失值的模型。（）

点击查看答案

第7题

想要完美的塑造语音亲和力,我们需要进行的专项训练主要包括（）。

A.气息控制

B.节奏变化

C.共鸣运用

D.语气表达

E.吐字归音

点击查看答案

第8题

Scratch有一个“画笔”模块，想要清空掉所有角色留在舞台上的痕迹，我们需要用到画笔中（）积木

A.落笔

B.抬笔

C.全部擦除

D.图章

点击查看答案

第9题

古时，有一个时代的女子，流行在脸上装饰黑色的圆点，她们模仿的似乎是我们费时费力、花费金钱想要去掉的斑点。请问这主要是什么朝代的风尚？（)

A.宋朝

B.唐朝

C.汉朝

点击查看答案

第10题

关于变分自编码器VAE，以下说法正确的有：（）

A.VAE的变分下界由KL散度项和模型重建误差项组成

B.VAE是一类生成模型，可用于训练出一个样本的生成器

C.VAE的变分下界中，KL散度项可以为负值

D.VAE广泛用于生成图像

点击查看答案

第11题

一个家庭有6个孩子。孩子的数量即为总体的大小。对总体进行不放回的简单随机抽样，样本容量为2，则有多少种可能的样本（）

A.12

B.15

C.3

D.16

点击查看答案

湖南优积谷网络科技有限公司版权所有 ©2024

湘ICP备16018319号-1 湘公安备案43019002000613号营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）