注册帐号丨忘记密码?
1.点击网站首页右上角的“充值”按钮可以为您的帐号充值
2.可选择不同档位的充值金额,充值后按篇按本计费
3.充值成功后即可购买网站上的任意文章或杂志的电子版
4.购买后文章、杂志可在个人中心的订阅/零买找到
5.登陆后可阅读免费专区的精彩内容
摘要:文章提出了一种基于网络爬虫的网页目标数据精准抓取方法,主要优化目标链接提取与业务数据缓存两个关键技术。针对传统布隆过滤器误判率高的问题,提出了基于链接特征的多级动态布隆过滤器,并结合链接属性的相关提取算法,提高了链接提取准确性和效率。同时,为优化缓存效率,设计了基于线程私有内存池的网页数据缓存管理模型,结合三层哈希的DNS预解析缓存策略,大幅提升了内存利用率和DNS解析效率。(剩余4941字)
登录龙源期刊网
购买文章
高性能网络爬虫系统的设计与实现
文章价格:4.00元
当前余额:100.00
阅读
您目前是文章会员,阅读数共:0篇
剩余阅读数:0篇
阅读有效期:0001-1-1 0:00:00