基于Swing 的HTML解析器的实现与应用

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘  要:HTML页面解析是一切工作的基础,通过分析HTML解析器感兴趣的标签以及超链接的分类,在Java的Swing包的基础上实现了一个HTML 解析器,用来提取HTML文档的超链接和锚文本;然后把HTML解析器应用到多媒体信息检索系统的搜索器Spider的开发中,通过设定若干个种子网站,选择合适的搜索算法,从中筛选出包含音频、视频和Flash 动画的web 页面,并将其存放在数据库中。(剩余5685字)

目录
monitor