XML / HTML 源码
提取结果 等待输入
»
匹配节点详细信息 (Matched Nodes)
暂无匹配结果
工具说明与 XPath 知识点
工具特点
- 双模式解析:支持标准的
HTML容错解析以及严格的XML解析,满足爬虫和数据提取的不同场景需求。 - 强大的编辑器:左侧代码区域集成
Ace Editor,支持语法高亮、自动折叠与代码补全。 - 多节点提取:实时执行 XPath 引擎运算,无论提取的是整个元素节点、单个属性还是纯文本,均可精准序列化并展示出来。
- 本地执行:计算完全在您的浏览器前端运行,绝无数据泄露风险,安全极速。
XPath 常用路径语法
/:从根节点选取。如果在最前面,表示绝对路径。如果在中间,表示直接子节点。//:从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置(跨层级提取神器)。.:选取当前节点。..:选取当前节点的父节点。@:选取属性。例如//@href选取文档中所有的 href 属性。
常用谓语 (Predicates) 与函数
- 按属性查找:
//div[@class='title']选取所有 class 属性值为 title 的 div 元素。 - 按位置查找:
//ul/li[1]选取 ul 下的第一个 li 元素(注意 XPath 索引从 1 开始)。 - 提取文本:
//a/text()选取 a 标签内的文本内容。 - 模糊包含查找:
//div[contains(@class, 'item')]选取 class 属性中包含 item 的所有 div。 - 多条件联合:
//input[@type='text' and @name='username']选取同时满足两个属性条件的节点。
