我想分析一个文本文件,例如:
div::
class:yo-d
text:example
id:my-class
h1:: Title
href:http://www.example.com
div::
class:class1
id:my-class2
它类似于重构文本。
每个
标签
以结束
::
可以有一些属性
attr:value
.
我想得到类似这样的东西,一个python字典:
{'div': {'attrs': {'text': 'example', 'class': 'yo-d', 'id': 'my-class'},
'sub': {'h1': {'content': 'Title', 'attrs': {'href': 'http://www.example.com'}},
'div': {'attrs': {'class': 'class1', 'id': 'my-class2'}},
},
}
}
后
附属的
有缩进标签,如果标签后面有东西
::
它进入
'content'
.
我会用麻风,但我不知道从哪里开始,有什么建议吗?
谢谢,
鲁比克