• 4.4 实现迭代器协议
    • 问题
    • 解决方案
    • 讨论

    4.4 实现迭代器协议

    问题

    你想构建一个能支持迭代操作的自定义对象,并希望找到一个能实现迭代协议的简单方法。

    解决方案

    目前为止,在一个对象上实现迭代最简单的方式是使用一个生成器函数。在4.2小节中,使用Node类来表示树形数据结构。你可能想实现一个以深度优先方式遍历树形节点的生成器。下面是代码示例:

    1. class Node:
    2. def __init__(self, value):
    3. self._value = value
    4. self._children = []
    5.  
    6. def __repr__(self):
    7. return 'Node({!r})'.format(self._value)
    8.  
    9. def add_child(self, node):
    10. self._children.append(node)
    11.  
    12. def __iter__(self):
    13. return iter(self._children)
    14.  
    15. def depth_first(self):
    16. yield self
    17. for c in self:
    18. yield from c.depth_first()
    19.  
    20. # Example
    21. if __name__ == '__main__':
    22. root = Node(0)
    23. child1 = Node(1)
    24. child2 = Node(2)
    25. root.add_child(child1)
    26. root.add_child(child2)
    27. child1.add_child(Node(3))
    28. child1.add_child(Node(4))
    29. child2.add_child(Node(5))
    30.  
    31. for ch in root.depth_first():
    32. print(ch)
    33. # Outputs Node(0), Node(1), Node(3), Node(4), Node(2), Node(5)

    在这段代码中,depth_first() 方法简单直观。它首先返回自己本身并迭代每一个子节点并通过调用子节点的 depth_first() 方法(使用 yield from 语句)返回对应元素。

    讨论

    Python的迭代协议要求一个 iter() 方法返回一个特殊的迭代器对象,这个迭代器对象实现了 next() 方法并通过 StopIteration 异常标识迭代的完成。但是,实现这些通常会比较繁琐。下面我们演示下这种方式,如何使用一个关联迭代器类重新实现 depth_first() 方法:

    1. class Node2:
    2. def __init__(self, value):
    3. self._value = value
    4. self._children = []
    5.  
    6. def __repr__(self):
    7. return 'Node({!r})'.format(self._value)
    8.  
    9. def add_child(self, node):
    10. self._children.append(node)
    11.  
    12. def __iter__(self):
    13. return iter(self._children)
    14.  
    15. def depth_first(self):
    16. return DepthFirstIterator(self)
    17.  
    18.  
    19. class DepthFirstIterator(object):
    20. '''
    21. Depth-first traversal
    22. '''
    23.  
    24. def __init__(self, start_node):
    25. self._node = start_node
    26. self._children_iter = None
    27. self._child_iter = None
    28.  
    29. def __iter__(self):
    30. return self
    31.  
    32. def __next__(self):
    33. # Return myself if just started; create an iterator for children
    34. if self._children_iter is None:
    35. self._children_iter = iter(self._node)
    36. return self._node
    37. # If processing a child, return its next item
    38. elif self._child_iter:
    39. try:
    40. nextchild = next(self._child_iter)
    41. return nextchild
    42. except StopIteration:
    43. self._child_iter = None
    44. return next(self)
    45. # Advance to the next child and start its iteration
    46. else:
    47. self._child_iter = next(self._children_iter).depth_first()
    48. return next(self)

    DepthFirstIterator 类和上面使用生成器的版本工作原理类似,但是它写起来很繁琐,因为迭代器必须在迭代处理过程中维护大量的状态信息。坦白来讲,没人愿意写这么晦涩的代码。将你的迭代器定义为一个生成器后一切迎刃而解。

    原文:

    http://python3-cookbook.readthedocs.io/zh_CN/latest/c04/p04_implement_iterator_protocol.html