Python案例怎么遍历树形结构？

wen python案例 2026-06-09 78

Python案例：如何高效遍历树形结构？从递归到迭代的实战指南

目录导读

为什么树形结构遍历是Python程序员的核心技能？
常见树形结构表示：嵌套字典、类对象与列表
深度优先遍历（DFS）实战案例
- 1 递归实现与风险控制
- 2 栈模拟非递归遍历（迭代版本）
广度优先遍历（BFS）实战案例
- 1 队列实现层级遍历
- 2 改进：带层级标识的遍历
复杂场景：无限级分类菜单、文件系统、JSON数据
性能优化：递归深度限制、内存优化与生成器应用
常见错误与问答（QA）
选择最适合你的遍历策略

为什么树形结构遍历是Python程序员的核心技能？

在Web开发（如无限分类菜单）、数据分析（XML/JSON解析）、算法设计（如决策树）、甚至日常文件管理中，树形结构无处不在。能够根据业务场景选择正确的遍历方式，直接影响代码的可读性、内存效率以及运行速度。

Python案例怎么遍历树形结构？

核心问题：你能否用Python优雅地处理深度为100的嵌套数据而不崩溃？能否在百万级节点中快速定位某个叶子节点？

常见树形结构表示

案例1：嵌套字典（轻量级）

menu = {
    "name": "系统管理",
    "children": [
        {"name": "用户管理", "children": [
            {"name": "添加用户"},
            {"name": "删除用户"}
        ]},
        {"name": "角色管理"}
    ]
}

案例2：类对象（面向对象风格）

class TreeNode:
    def __init__(self, value, children=None):
        self.value = value
        self.children = children or []

案例3：列表+元组（最简形式）

tree = ("root", [
    ("child1", [("grandchild1", []), ("grandchild2", [])]),
    ("child2", [])
])

选择原则：简单场景用字典/元组；需要方法绑定用类；大数据量用list+索引。

深度优先遍历（DFS）实战案例

1 递归实现（经典但需注意风险）

def dfs_recursive(node, level=0):
    # 处理根节点
    print("  " * level + node["name"])
    # 遍历子节点
    for child in node.get("children", []):
        dfs_recursive(child, level + 1)
# 调用
dfs_recursive(menu)

优点：代码简洁，逻辑直观。
隐患：Python默认递归深度限制约为1000层，可修改sys.setrecursionlimit(10000),但可能引发栈溢出。

2 迭代实现（自建栈，可控性强）

def dfs_iterative(root):
    stack = [(root, 0)]
    while stack:
        node, level = stack.pop()
        print("  " * level + node["name"])
        # 注意：逆序压栈以保持顺序
        for child in reversed(node.get("children", [])):
            stack.append((child, level + 1))
# 调用
dfs_iterative(menu)

问答Q1：为什么递归比迭代更容易导致内存问题？
A：递归调用会占用函数调用栈，每个未返回的调用占一份内存；而迭代使用自己维护的栈,可以更精细地控制内存释放。

广度优先遍历（BFS）实战案例

1 队列实现层级遍历

from collections import deque
def bfs_tree(root):
    queue = deque([root])
    while queue:
        node = queue.popleft()
        print(node["name"])
        # 按顺序加入子节点
        for child in node.get("children", []):
            queue.append(child)
# 调用
bfs_tree(menu)

输出效果：先打印“系统管理”，再打印所有子节点（“用户管理”，“角色管理”）,然后打印孙节点。

2 带层级标识的BFS

def bfs_with_level(root):
    queue = deque([(root, 0)])
    current_level = 0
    print(f"Level {current_level}:")
    while queue:
        node, level = queue.popleft()
        if level != current_level:
            current_level = level
            print(f"\nLevel {current_level}:")
        print(f"  {node['name']}", end="")
        for child in node.get("children", []):
            queue.append((child, level + 1))
# 输出类似
# Level 0: 系统管理
# Level 1: 用户管理 角色管理
# Level 2: 添加用户 删除用户

问答Q2：什么时候用DFS，什么时候用BFS？
A：

当问题与“路径”相关（如查找两个节点间是否存在路径），DFS可快速深入。
当需要“最短路径”或按层级处理（如生成多级菜单缩进），BFS更直观。
当树极深但广度小，DFS比BFS更省内存（BFS需要队列存储所有同层节点）。

复杂场景实战

场景1：无限级分类菜单（电商/后台系统）

需求：给定用户点击的菜单ID，找出其所有父级名称。

def find_parents(tree, target_id, path=None):
    if path is None:
        path = []
    if isinstance(tree, dict):
        current_id = tree.get("id")
        if current_id == target_id:
            return path + [tree["name"]]
        path.append(tree["name"])
        for child in tree.get("children", []):
            result = find_parents(child, target_id, path.copy())
            if result:
                return result
        path.pop()
    return None
# 示例数据：menu带id字段
parent_chain = find_parents(menu, 3)  # 假设目标id=3
print(" -> ".join(parent_chain))  # 输出：系统管理 -> 用户管理 -> 添加用户

场景2：文件系统遍历（os.walk本质就是DFS）

import os
def walk_path(path):
    for root, dirs, files in os.walk(path):  # 内置DFS
        level = root.replace(path, "").count(os.sep)
        indent = " " * level * 2
        print(f"{indent}[{os.path.basename(root)}]")
        sub_indent = " " * (level + 1) * 2
        for file in files:
            print(f"{sub_indent}{file}")
# 调用
walk_path("/your/project")

场景3：JSON数据中提取所有邮箱

def extract_emails(data, emails=None):
    if emails is None:
        emails = set()
    if isinstance(data, dict):
        for key, value in data.items():
            if key == "email" and isinstance(value, str):
                emails.add(value)
            else:
                extract_emails(value, emails)
    elif isinstance(data, list):
        for item in data:
            extract_emails(item, emails)
    return emails
# 示例
sample_json = {
    "users": [
        {"name": "Alice", "email": "alice@example.com"},
        {"name": "Bob", "children": {"email": "bob-child@test.com"}}
    ]
}
print(extract_emails(sample_json))  # {'alice@example.com', 'bob-child@test.com'}

性能优化技巧

生成器：避免一次加载所有节点

def dfs_generator(node):
    yield node
    for child in node.get("children", []):
        yield from dfs_generator(child)
# 使用
for n in dfs_generator(menu):
    print(n["name"])

显式栈优化（减少内存分配）

def dfs_fast(root):
    stack = [root]
    while stack:
        node = stack.pop()
        print(node["name"])
        # 预分配子节点列表，减少append开销
        children = node.get("children", [])
        stack.extend(reversed(children))  # 一次性压入

缓存节点数量（大型树）

from functools import lru_cache
class CachedTree:
    def __init__(self, node):
        self.node = node
        self._children = None
    @lru_cache(maxsize=None)
    def get_children(self):
        return [CachedTree(c) for c in self.node.get("children", [])]

问答Q3：如果树有10万节点，哪种遍历性能最好？
A：

迭代DFS（显式栈）通常比递归版快10-20%。
如果只需部分节点，生成器版最省内存。
避免在递归中频繁拷贝path列表，可用回溯算法优化（在场景1中，使用path.append后pop）。

常见错误与问答（QA）

Q4：为什么我修改了节点但遍历没有反映变化？
A：如果你在遍历时动态增删节点，可能引发RuntimeError: dictionary changed size during iteration，解决方案：

收集要修改的节点引用到列表，遍历完成后再操作。
使用list(tree.items())创建快照。

Q5：如何防止无限循环（存在循环引用）？
A：给每个节点添加唯一ID，遍历时维护一个visited集合：

def safe_dfs(node, visited=None):
    if visited is None:
        visited = set()
    node_id = id(node)  # 或 node["id"]
    if node_id in visited:
        return
    visited.add(node_id)
    # 继续遍历子节点...

Q6：递归版可以用尾递归优化吗？
A：Python不支持尾递归优化，如果你需要处理超深树,必须用迭代。

选择最适合你的遍历策略

场景	推荐方法	理由
纯数据提取（打印所有节点）	生成器 + DFS	内存友好，代码简洁
需要层级缩进展示	BFS带层级	直观看到树的结构
极深树（>500层）	迭代栈DFS	避免递归溢出
查找两个节点间路径	DFS回溯	利用递归的隐式栈
处理Web API返回的嵌套JSON	递归DFS	代码简洁，数据量通常不大

最后建议：将核心遍历逻辑封装成通用函数（如walk_tree(node, mode='dfs')），并加入参数控制最大深度、回调函数等，这样可以一劳永逸地解决项目中80%的树遍历需求。

本文基于Python 3.10+版本编写，示例代码可在任何支持Python的环境直接运行。