基于TF-IDF和word2Vec的中文文本自动摘要模型

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：随着互联网时代的数据爆炸，在短文本信息数量迅速增长的环境下，为了更好地进行中文本摘要模型的计算，本文针对短文本的文本特征提取和相似度计算进行了深入研究。本文将优化的TF-IDF模型和Word2Vec模型结合起来，进而提出一种兼顾短文本统计特征和语义特征的合并加权Word2Vec和TF-IDF的文本特征提取算法，将文本进行向量化表示；随后，在文本的相似度算法中，基于短文本的特征，选取了余弦相似度算法，对短文本间相似度值进行了有效计算。（剩余3975字）

试读结束

购买全文4.00元下一篇浅谈部分遮挡下的人脸识别技术研究

中国新通信

2023年02期

¥9.69/本