A.关键词提取是指用人工方法提取文章关键词的方法
B.TF-IDF模型是关键词提取的经典方法
C.文本中出现次数最多的词最能代表文本的主题
D.这个问题设计数据挖掘,文本处理,信息检索等领域
A.支持在海量文本数据中快速查找有效信息
B.支持N-gram、SCWS两种中文分词算法,准确率与查准率较高
C.文本检索类型支持tsvector和tsquery两种
D.可以对搜索结果进行排序
A.正向最大匹配法(由左到右的方向)
B.逆向最大匹配法(由右到左的方向)
C.最少切分(使每一句中切出的词数最小)
D.双向最大匹配法(进行由左到右、由右到左两次扫描)
A.Normalization
B.TokenizationStopwords
C.Part-of-speechTagging
D.NamedEntityRecognition
A.InverseNormalizer对应用途是使用ModelSquid的Model给出输入数据的预测值
B.CsvAssemble对应用途是把多个字符串拼接成CSN格式的字符串
C.Tokenization对应用途是把文本按照分词规则转化为CSN
D.Predict对应用途是逆标准化