A.Jieba专注于中文分词操作
B.NLTK主要用于一般自然语言处理任务(标记化,POS标记,解析等)
C.Gensim主要用于题和向量空间建模、文档集合相似性等
D.Scikit-learn为机器学习提供了一个大型库,其中包含了用于文本预处理的工具,例如词频-逆文档频率特征提取(TfidfVectorizer)等。
A.基于帐户权重不同,选用几分词实际上没有办法用固定的标准
B.6分词也可以选用,但是5分以下的词就没有必要用了,5分以下的词无线端没有展现
C.要选8分以上的词才会有好的流量和展现,才能拿到比较优惠的流量
D.7分以下的词就没有必要用了,分太低要不就没什么流量,有流量点击单价也是偏贵