题目内容
(请给出正确答案)
[多选题]
我们想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型()。
A.对训练集随机采样,在随机采样的数据上建立模型
B.尝试使用在线机器学习算法
C.使用PCA算法减少特征维度
查看答案
如果结果不匹配,请 联系老师 获取答案
A.对训练集随机采样,在随机采样的数据上建立模型
B.尝试使用在线机器学习算法
C.使用PCA算法减少特征维度
A.使用前向特征选择方法
B.使用后向特征排除方法
C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征
D.查看相关性表,去除相关性最高的一些特征
A.级别划分较多的属性不会影响模型效果
B.在某些噪音较大的分类或回归问题上不会过拟合
C.每次学习使用不同训练集,一定程度避免过拟合
D.能够处理高纬度的数据,并且不做特征选择
A.模型学习到了样本的一般性质
B.学习迭代次数过多
C.训练集数量级和模型复杂度不匹配,训练集的数量级小于模型的复杂度
D.训练集和测试集特征分布不一致
A.VAE的变分下界由KL散度项和模型重建误差项组成
B.VAE是一类生成模型,可用于训练出一个样本的生成器
C.VAE的变分下界中,KL散度项可以为负值
D.VAE广泛用于生成图像