我正在使用Python 3和Scrapy。
这是我的HTML的一部分:
<div class="class=a1">
<span class="a-small">TEXT <a class="a-nm" href="/a/b=data1?ie=UTF8&what-i-want=Nice+Home&the-data=correct&text=ABA+DNA&sort=yes">That's Correct
</span>
</div>
在
href
有以下文字:
what-i-want
.我想找到
Nice+Home
,之后的任何事情
what-i-want=
在
&
在
href
。
我试着先提取
href
:
the_href = response.xpath('//a[contains(@href, "what-i-want")]/@href')
我以为它会回来
/a/b=data?ie=UTF8&what-i-want=Nice+Home&the-data=correct&text=ABA+DNA&sort=yes
这样我就可以提取
漂亮+家
但它不起作用。
我该怎么做?
使现代化
这就是我在
the_href
输出:
[<Selector xpath='//a[contains(@href, "what-i-want")]/@href' data='/a/b=data1?ie=UTF8&t'>,
<Selector xpath='//a[contains(@href, "what-i-want")]/@href' data='/a/b=data2?ie=UTF8&t'>,
<Selector xpath='//a[contains(@href, "what-i-want")]/@href' data='/a/b=data3?ie=UTF8&t'>,
<Selector xpath='//a[contains(@href, "what-i-want")]/@href' data='/a/b=data4?ie=UTF8&t'>]