• 6.6 解析和修改XML
    • 问题
    • 解决方案
    • 讨论

    6.6 解析和修改XML

    问题

    你想读取一个XML文档,对它最一些修改,然后将结果写回XML文档。

    解决方案

    使用 xml.etree.ElementTree 模块可以很容易的处理这些任务。第一步是以通常的方式来解析这个文档。例如,假设你有一个名为 pred.xml 的文档,类似下面这样:

    1. <?xml version="1.0"?>
    2. <stop>
    3. <id>14791</id>
    4. <nm>Clark &amp; Balmoral</nm>
    5. <sri>
    6. <rt>22</rt>
    7. <d>North Bound</d>
    8. <dd>North Bound</dd>
    9. </sri>
    10. <cr>22</cr>
    11. <pre>
    12. <pt>5 MIN</pt>
    13. <fd>Howard</fd>
    14. <v>1378</v>
    15. <rn>22</rn>
    16. </pre>
    17. <pre>
    18. <pt>15 MIN</pt>
    19. <fd>Howard</fd>
    20. <v>1867</v>
    21. <rn>22</rn>
    22. </pre>
    23. </stop>

    下面是一个利用 ElementTree 来读取这个文档并对它做一些修改的例子:

    1. >>> from xml.etree.ElementTree import parse, Element
    2. >>> doc = parse('pred.xml')
    3. >>> root = doc.getroot()
    4. >>> root
    5. <Element 'stop' at 0x100770cb0>
    6.  
    7. >>> # Remove a few elements
    8. >>> root.remove(root.find('sri'))
    9. >>> root.remove(root.find('cr'))
    10. >>> # Insert a new element after <nm>...</nm>
    11. >>> root.getchildren().index(root.find('nm'))
    12. 1
    13. >>> e = Element('spam')
    14. >>> e.text = 'This is a test'
    15. >>> root.insert(2, e)
    16.  
    17. >>> # Write back to a file
    18. >>> doc.write('newpred.xml', xml_declaration=True)
    19. >>>

    处理结果是一个像下面这样新的XML文件:

    1. <?xml version='1.0' encoding='us-ascii'?>
    2. <stop>
    3. <id>14791</id>
    4. <nm>Clark &amp; Balmoral</nm>
    5. <spam>This is a test</spam>
    6. <pre>
    7. <pt>5 MIN</pt>
    8. <fd>Howard</fd>
    9. <v>1378</v>
    10. <rn>22</rn>
    11. </pre>
    12. <pre>
    13. <pt>15 MIN</pt>
    14. <fd>Howard</fd>
    15. <v>1867</v>
    16. <rn>22</rn>
    17. </pre>
    18. </stop>

    讨论

    修改一个XML文档结构是很容易的,但是你必须牢记的是所有的修改都是针对父节点元素,将它作为一个列表来处理。例如,如果你删除某个元素,通过调用父节点的 remove() 方法从它的直接父节点中删除。如果你插入或增加新的元素,你同样使用父节点元素的 insert()append() 方法。还能对元素使用索引和切片操作,比如 element[i]element[i:j]

    如果你需要创建新的元素,可以使用本节方案中演示的 Element 类。我们在6.5小节已经详细讨论过了。

    原文:

    http://python3-cookbook.readthedocs.io/zh_CN/latest/c06/p06_parse_modify_rewrite_xml.html