为适应网络环境下海量文本大数据形式化、结构化、语义化处理的需要,《汉语主题词表》最新修订从哪年开始进行()。
A.1991年
B.2007年
C.2017年
D.2009年
A.1991年
B.2007年
C.2017年
D.2009年
A.Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
B.Hadoop被视为事实上的大数据处理标准
C.Hadoop为海量数据提供存储的HDFS和对数据进行计算的MapReduce
D.Hadoop提供整个HDFS文件系统的命名空间管理,块管理等所有服务
A.为避开业务高峰时间段,备份可以选择在23:006:00执行
B.海量小文件场景下,不适合采用卷备份
C.如果全量备份时间太长,则安排在周末的时间窗口进行,每天晚上可进行增量或差异备份
D.该企业备份应该错峰进行,大数据量备份应与小数据量备份结合
A.为避开业务高峰时间段,备份可以选择在23:006:00执行
B.海量小文件场景下,不适合采用卷备份
C.如果全量备份时间太长,则安排在周末的时间窗口进行,每天晚上可进行增量或差异备份
D.该企业备份应该错峰进行,大数据量备份应与小数据量备份结合
A.支持在海量文本数据中快速查找有效信息
B.支持N-gram、SCWS两种中文分词算法,准确率与查准率较高
C.文本检索类型支持tsvector和tsquery两种
D.可以对搜索结果进行排序
A.数据容量问题
B.数据安全问题
C.数据处理问题
D.数据分析问题
A.数据采集是通过传感器、移动互联网、观测设备等获得种多类型的海量数据
B.数据预处理是数据分析和挖掘的基础,是将接收数据进行抽取、清洗、转换、归约等并最终加载到数据存储中的过程
C.数据存储过程需要将采集到的数据进行存储管理,在大数据场景下,只能使用非关系型数据库进行存储
D.数据分析是指利用相关数学模型以及机器学习算法对数据进行统计、预测和文本分析。数据的主要分析方法有探索性数据分析方法、描述统计法、数据可视化等