***
一种网络爬虫的页面列表信息自动提取方法及系统
知法狮VIP-黄金卡
尊享会员价、24小时在线客服、7天无理由退换货
立即开通
贴心服务
快速响应
售后保障
快捷支付
专业团队
担保交易
领券
无门槛减69.99
满2000减138
  • 介绍
  • 参数

请编辑该产品详情...

价格
***
专利号
2020102221324
专利类型
发明
申请日
2020-03-26 00:00:00
公开日
2020-07-24 00:00:00
法律状态
有效
国家/地区
中国
IPC分类号
G06F16/951
技术领域
G-物理
申请人/权利人
桂林理工大学
摘要
本发明涉及一种网络爬虫的页面列表信息自动提取方法及系统。该方法包括:获取待提取的页面的超文本标记语言文档;根据所述超文本标记语言文档中的元素确定超文本标记语言对象集合;对所述超文本标记语言对象集合进行遍历,确定文档对象模型;根据所述文档对象模型确定所述待提取的页面的网页结构;所述网页结构包括列表项和列表项属性;根据所述待提取的页面的网页结构确定提取模式;利用所述提取模式对所述待提取的页面列表信息进
首页
客服
购物车
加入购物车
立即下单