我在下面有文字-
how much production in batu
现在,此文本显示为一系列
html
标签。基本上每个单词都用
span
有一个特定的
style
或
class
. 这是它的样子
'<span style="">how </span><span style="">much </span><span class="pink-highlight">production </span><span style="">in </span><span class="yellow-highlight">batu</span>'
现在我想要两样东西
html格式
字符串:范围内的样式或类和内容(不带
)
所以我想要一个
array
字符串中的以下信息
[["", "how"], ["", "much"], ["pink-highlight", "production"], ["", "in"], ["yellow-highlight", "batu"]]
现在可以使用
regex
. 但我不太熟悉
正则表达式
. 我能想到的模式
<span>(.*?)</span>
但它只会发现里面的内容
跨度
而且在这种情况下都不起作用
跨度
有一个
风格
标签或类。
那又怎么样
正则表达式
在这种情况下,最好应用它来获得期望的结果吗?