多视角网页分类数据集构建及性能评估

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:网页分类是互联网数据挖掘中的一项重要任务,在信息搜索、推荐系统和知识发现等领域发挥着关键作用. 然而,现有的公开网页数据集缺乏多视角信息,难以适用于蕴含复杂特征的网页分类任务. 针对上述问题,基于“收集⁃处理⁃标注”构建流程,提出一个涵盖文本语义、网页结构等多视角特征的网页数据集Web⁃Min(剩余326字)

monitor
客服机器人