代码之家 › 专栏 › 技术社区 › Purrell

XPATH查询中的html 4.0实体

xpath

Purrell · 技术社区 · 15 年前

//h3[text()='Foo &rsaquo; Bar']

不匹配:

<h3>Foo &rsaquo; Bar</h3>

2 回复 | 直到 15 年前

Pavel Minaev 15 年前

XPath没有定义任何特殊的转义序列。当XPath在XSLT中使用时(例如在XSLT文档元素的属性中),转义序列由读取样式表的XML处理器处理。如果通过库在非XML上下文(例如,来自Java或C#或其他语言)中使用XPath,并且XPath查询是该语言中的字符串文本,那么除了该语言本身通常进行的转义处理之外,您将不会得到任何转义处理。

如果这是C#或Java,那么应该可以:

String xpath = "//h3[text()='Foo \u8250 Bar']";
...

顺便说一句,它在XSLT中也不起作用,因为XSLT使用XML,而XML不定义字符实体 &rsaquo; < , > , " ' 和 & 艐

Quentin 15 年前

从 XPath specification :

XPath操作XML文档的抽象逻辑结构,而不是其表面语法

因此,除非您在解析该实体的语言(可能是XSLT和包含该实体的DTD(如果可能的话,我远非XSLT专家))中使用查询(而不是“to query”),否则我不会期望它工作。

使用由使用XPath的任何语言识别的文字字符或转义序列。

推荐文章

Monica · 使用Selenium和Python在没有url的情况下单击下载文件

2 年前

JobProcessTask · 如何读取此xpath表达式?

2 年前

ÐÐ½Ð´ÑÐµÐ¹ Ð¡Ð¼Ð¸ÑÐ½Ð¾Ð² · 通过xplpath从xml加载字段时出现问题

2 年前

johns7843 · 如何使用xpath收集所有HREF?Selenium-Python

2 年前

js1069 · 如何通过匹配第一个元素中的文本来获取第二个元素。在Selenium中,Python

2 年前

Tony · IMPORTXML的正确XPATH(用于Yahoo Finance)

2 年前

Astro-Otter · 在DOMXpath中使用preg_match来匹配文本contgent

3 年前

mathias5986 · HTML Selenium Python点击href链接

3 年前

lord stock · 硒在iframe中引发与下拉菜单相互作用的非接触元素异常

3 年前

Tyler Moore · 如何在Selenium for Python中使用多个属性(包括部分字符串匹配)和find_元素

3 年前