XML / HTML 源码
提取结果 等待输入
»
匹配节点详细信息 (Matched Nodes)
暂无匹配结果

工具说明与 XPath 知识点

工具特点

  • 双模式解析:支持标准的 HTML 容错解析以及严格的 XML 解析,满足爬虫和数据提取的不同场景需求。
  • 强大的编辑器:左侧代码区域集成 Ace Editor,支持语法高亮、自动折叠与代码补全。
  • 多节点提取:实时执行 XPath 引擎运算,无论提取的是整个元素节点、单个属性还是纯文本,均可精准序列化并展示出来。
  • 本地执行:计算完全在您的浏览器前端运行,绝无数据泄露风险,安全极速。

XPath 常用路径语法

  • /:从根节点选取。如果在最前面,表示绝对路径。如果在中间,表示直接子节点。
  • //:从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置(跨层级提取神器)。
  • .:选取当前节点。
  • ..:选取当前节点的父节点。
  • @:选取属性。例如 //@href 选取文档中所有的 href 属性。

常用谓语 (Predicates) 与函数

  • 按属性查找: //div[@class='title'] 选取所有 class 属性值为 title 的 div 元素。
  • 按位置查找: //ul/li[1] 选取 ul 下的第一个 li 元素(注意 XPath 索引从 1 开始)。
  • 提取文本: //a/text() 选取 a 标签内的文本内容。
  • 模糊包含查找: //div[contains(@class, 'item')] 选取 class 属性中包含 item 的所有 div。
  • 多条件联合: //input[@type='text' and @name='username'] 选取同时满足两个属性条件的节点。