代码之家 › 专栏 › 技术社区 › AK88

从XML文档获取数据

pandas python-3.x xml

AK88 · 技术社区 · 6 年前

我正在努力从XML文档中获取数据。我正在寻找这个来源: http://cbu.uz/uzc/arkhiv-kursov-valyut/xml/USD/2015-03-26/

<CcyNm_EN>U.S. Dollar</CcyNm_EN>
<Nominal>1</Nominal>
<Rate>2484.15</Rate>
<date>24.03.2015</date>

到目前为止,我可以在这里取得进展,但我不知道接下来要做什么:

import requests
import xml.etree.ElementTree as et
import pandas as pd

url = 'http://cbu.uz/uzc/arkhiv-kursov-valyut/xml/USD/2015-03-26/'
xml_data = requests.get(url).content
root = et.fromstring(xml_data)
root.attrib

1 回复 | 直到 6 年前

Sach 6 年前

您可以使用下面的代码来获取值。基本上,您需要在根节点上迭代以找到所有子节点并提取数据。

编辑:更新答案,使其在Dataframe中有输出,并且在输出中只有四个元素。

import requests
import xml.etree.ElementTree as et
import pandas as pd

url = 'http://cbu.uz/uzc/arkhiv-kursov-valyut/xml/USD/2015-03-26/'
xml_data = requests.get(url).content
root = et.fromstring(xml_data)
required_tag = [ 'CcyNm_EN','Nominal','Rate','date']

root.attrib

data_dict = {}
for elem in root:
    for el in elem:  
        if el.tag in required_tag:
            data_dict.setdefault(el.tag,[]).append(el.text)

df = pd.DataFrame.from_dict(data_dict)

   CcyNm_EN   Nominal Rate     date
0 U.S. Dollar 1       2484.15  24.03.2015

推荐文章

JobProcessTask · 如何读取此xpath表达式?

2 年前

Sven K · 无法访问XML数据结构中的“数据”:“名称属性>数据”

2 年前

sklal · 在Python中从S3存储桶读取xml文件——只存储最后一个文件的内容

2 年前

MBF · PHP导入/解析XML文件内容保存到数据库

2 年前

TenkMan · SQL Server XML嵌套值查询表单990

2 年前

lam62 · 如何使用XML从XHTML/XML中提取相关数据。dom。小型化

2 年前

Mohan.Murali.Peddini · XSLT模板循环记录

2 年前

mayo0o · 检查元素的总和

2 年前

crichavin · 排除XSLT的(1.0)行返回和文本输出中的额外空白

2 年前

Crimp · 从Excel导出后,在XML文件和PowerShell输出中发现奇怪字符:

2 年前