机器学习中,“降维”是指通过保留一些比较重要的特征,去除一些冗余的特征,从而减少数据特征的维度。如:当我们需要处理大量文章的主题分析时,可以通过__算法,结合潜在语义分析(LSA),对文章中的词汇进行聚类(如“万科”和“地产”聚类的关联度要大于“万科”和“王者荣耀”)。之后,按照聚类出现的效果,可以提取文档集合中的近义词,这样当用户检索文档的时候,是用语义级别(近义词集合)去检索了,而不是之前的词的级别,即实现了降维()
否
否
A.由用户事先指定
B.通过在d值不同的低维空间中对开销较小的学习器进行交叉验证来选取
C.可从重构的角度设置一个重构阈值,选取使得特定公式成立的最小值
D.随机设置
A.主成分分析是一种常用的非线性降维方法
B.核化线性降维是一种常用的线性降维方法
C.流形学习是一种借鉴拓扑流形概念的降维方法
D.度量学习绕过降维的过程,将学习目标转化为对距离度量计算的权重矩阵的学习
A.PCA和LDA均是基于监督学习的降维方法
B.假设原始数据一共有K个类别,那么LDA所得数据的降维维度小于或等于K−1
C.LDA降维后所得到维度是与数据样本的类别个数K有关(与数据本身维度无关)
D.PCA对高维数据降维后的维数是与原始数据特征维度相关(与数据类别标签无关)
A.数据采集是通过传感器、移动互联网、观测设备等获得种多类型的海量数据
B.数据预处理是数据分析和挖掘的基础,是将接收数据进行抽取、清洗、转换、归约等并最终加载到数据存储中的过程
C.数据存储过程需要将采集到的数据进行存储管理,在大数据场景下,只能使用非关系型数据库进行存储
D.数据分析是指利用相关数学模型以及机器学习算法对数据进行统计、预测和文本分析。数据的主要分析方法有探索性数据分析方法、描述统计法、数据可视化等
A.解释学习需要环境提供一组示例,而示例学习只要环境提供一个示例
B.机械式学习是有推理能力
C.符号学习对模拟人类较低级的神经活动是比较有效的
D.观察与发现学习是基于归纳推理的
A.可以通过这一门课程学习就完全完成的
B.是要在今后一系列学习和工作等过程中有目的地培育中提升的
C.可以通过一些计算机专业课程学习完全实现的
D.只能在今后工作中获得提高