基于LDA-TF-IDF和Word2vec文档表示

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：针对自然语言处理中传统文档表示方法上下文语义信息不全，干扰词多等问题，提出了一种基于LDA-TF-IDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理；其次，利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词，并计算对应权重；最后，应用数据集训练Word2vec模型获取词向量，并将抽取的特征词权重融入Word2vec词向量构建文档语义向量。（剩余6900字）

试读结束

购买全文5.00元

浙江纺织服装职业技术学院学报

2023年02期

¥7.29/本

关于龙源 关于我们联系我们龙源大事记诚聘英才用户守则 购刊指南 电子刊购买流程会员介绍常见问题 客服中心 联系客服开具发票 商务合作 商务合作 网络信息举报
违法和不良信息举报电话：400-106-1235

举报邮箱：longyuandom@163.com
网上有害信息举报专区 支付方式 支付宝在线支付公司转账邮局汇款 特色服务 刊社入口友情链接

关注微信公众号
获取更多资讯
北京龙源网通电子商务有限公司
（署）网出证（京）字第188号丨京公网安备 11011302003690号丨京ICP备18053758号-2