1
1
要解决换行符问题,请考虑将信息也存储为JSON文件。这将使解析更加容易,这就是它的设计目的!它还允许您在将来向程序添加功能。 这与你的问题关系不大,OP.但不建议从网页中删除HTML数据。我不知道如何解析数据,但如果网站的设计发生变化,可能会影响解析器。 更好的方法是寻找API。哪个metcheck 有 . 更多信息 here . 更准确地说, this (查看JSON URL下)。
站点示例:
|
2
1
你可以
|
3
0
找到了一种方法: 使用。格式化,将值插入URL字符串,然后将其作为urllib的参数传递。要求urlopen(*args)
我认为发生错误的原因是因为这些值被写入文本文件,并且在每个条目的末尾使用了“换行符”。这意味着当URL试图格式化文本文件中的数据时,它也会读取换行符条目,这意味着URL无效。我通过简单地更改代码来解决这个问题,以便将数据写入文本文件的一行,并用逗号分隔。然后。split函数用于分离数据的每个部分,以便将其形成一个列表,然后将列表中的每个元素简单地传递到URL中。很有技巧,但它确实起到了作用。
|
Nathan123 · 用于刮取结果的脚本似乎不起作用? 6 年前 |
Hojat Taheri · 在python 3中从页面提取链接 6 年前 |
Roman · urllib:html到csv错误 6 年前 |
Richard Smith · 从文本文件复制数据并将其插入URL 6 年前 |
Jorge Galán · 使用BeautifulSoup分析错误 6 年前 |