首页 > 其他
题目内容 (请给出正确答案)
[单选题]

在TF-IDF算法中,在计算完词频与逆文档频率后,将二者()后得到最终的结果。

A.相加

B.相减

C.相乘

D.相除

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“在TF-IDF算法中,在计算完词频与逆文档频率后,将二者()…”相关的问题
第1题
关于TF-IDF模型描述正确的有()。

A.TF意思是词频

B.IDF是逆文本频率

C.该模型基于统计方法

D.在信息检索中应用较少

点击查看答案
第2题
以下属于关键词提取算法的有()。

A.TF-IDF算法

B.TextRank算法

C.LSA(潜在语义分析)

D.LDA

点击查看答案
第3题
与自然语言处理相关的工具包Jieba,Gensim,NLTK,Scikit-Learn的区别是()。

A.Jieba专注于中文分词操作

B.NLTK主要用于一般自然语言处理任务(标记化,POS标记,解析等)

C.Gensim主要用于题和向量空间建模、文档集合相似性等

D.Scikit-learn为机器学习提供了一个大型库,其中包含了用于文本预处理的工具,例如词频-逆文档频率特征提取(TfidfVectorizer)等。

点击查看答案
第4题

词w在文档d中的词频tf(Term Frequency)的计算公式是:()。

点击查看答案
第5题
凯文·凯利在《必然》中描绘的未来30年的12个商业趋势中,知化是指人工智能发展商机,近期的三大突破:廉价的并行计算;大数据;更好的算法等将开启人工智能时代。()
点击查看答案
第6题
下列哪些是TF-IDF的缺点()。

A.字词的重要性随它在文件中出现的次数成正比

B.将一些生僻字误当作文档关键词

C.只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况

D.没有考虑特征词的位置因素对文本的区分度

点击查看答案
第7题
下列算法中,哪个不是在素数域中计算离散对数的?()

A.线性筛法

B.高斯整数法

C.二次筛法

D.数域筛法

点击查看答案
第8题
在网络爬虫策略中需要根据链接计算网页重要性的是以下哪个算法()?

A.深度优先

B.OPIC

C.广度优先

D.局部PageRank策略

点击查看答案
第9题
哪种算法从在有限域中计算离散对数的困难中获得了安全性,并用于分发密钥,但不能用于加密或解密消息()。

A.Kerberos。

B.数字签名算法(DSA)。

C.迪菲-赫尔曼。

D.Rivest-Shamir-Adleman(RSA)。

点击查看答案
第10题
关于微机保护A/D数据采集系统不正确的说法是()。
A.直接式A/D数据采集系统中,A/D转换结果可直接用于保护的有关算法;而VFC式数据采集系统属于计数式电压频率转换芯片,微处理器每隔一定时间读得的计数器的计数值不能直接用于计算,必须将相隔NTs的计数值相减后才能用于各种算法的计算

B.直接式A/D转换是瞬时值比较,抗干扰能力强;VFC式A/D转换是取采样间隔内的平均值,抗干扰能力差

C.直接式A/D芯片一经选定其数字输出位数不可改变,即分辨率不可能变化;而VFC数据采集系统中可通过增大计算间隔提高分辨

D.VFC式A/D转换器与计数器之间的光电耦合器,使数据采集系统与CPU系统在电气回路上完全隔离,抗干扰能力强

点击查看答案
第11题
在朴素贝叶斯算法中,假设样本独立同分布,假设共有m种标签,只需计算取()作为预测的分类标签。

A.最小值

B.平均数

C.中位数

D.最大值

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改