代码之家 › 专栏 › 技术社区 › jturnbull

从HTML文件中间的设置点中提取上下文

extract xpath php

jturnbull · 技术社区 · 14 年前

我有一些HTML,我在某个点提取了一个片段(内联图像),但我想展示一下这个图像的上下文。

我使用PHP,我知道SimfOnand WordPress都提供了一些功能来处理当你在一些HTML中间截取文本时发生的事情(它关闭所有打开的标签),但是在另一个方向上没有处理代码片段。

因此,在以下情况下:

 'Snippet of text and a <a href="#moo">link right her'

我可以使用上述功能进行修复,但是:

'nk right here</a> and then more text after the link.'

我考虑过这样一种可能性,即即使是标记结束片段也可能是错误的方式,我应该使用Xpath来解析HTML。然而,我找不到任何使用xpath创建这样的代码片段的例子或提及。

更新:

所以我现在的想法是:

这仍然不理想,因为我不确定我需要退多远才能获得文本内容。

有人知道这个想法在哪里得到了实施吗?

1 回复 | 直到 9 年前

outis 14 年前

这不是一个完整的答案,但您可以使用xpath查询来获取感兴趣的节点,然后使用nextSibling和previousSibling属性(以扩展支持的任何形式)来获取节点的上下文。

推荐文章

Essi · R-基于匹配值从另一个数据帧添加数据[重复]

6 年前

wen tian · 使用beautifulsoup从网站中提取数字?

7 年前

user7579444 · 在Python中,如何获取相同字符的数量及其在字符串中的位置?

7 年前

Ty Kayn · PHP7中的ZipArchive找不到zip的内容

7 年前

YazOT · 使用python从文本文件中提取特定行

7 年前

plaidshirt · JMeter JSON提取器按条件获取值

7 年前

Pau · 从字符串中提取超链接的Php函数

7 年前

kroy2008 · 从选定尾注生成的字符串中提取文本

7 年前

Fabio Favoretto · 在R中匹配不同数据帧中的站点

7 年前

hoperose · 如何使用python中的正则表达式从文件中提取特定段落?

7 年前