构建二叉树问题
构建二叉树问题(前序和中序)
question
给定一棵二叉树的前序遍历 `preorder` 和中序遍历 `inorder` ,请从中构建二叉树,返回二叉树的根节点。假设二叉树中没有值重复的节点(如下图所示)。
判断是否为分治问题
原问题定义为从 preorder
和 inorder
构建二叉树,是一个典型的分治问题。
- 问题可以分解:从分治的角度切入,我们可以将原问题划分为两个子问题:构建左子树、构建右子树,加上一步操作:初始化根节点。而对于每棵子树(子问题),我们仍然可以复用以上划分方法,将其划分为更小的子树(子问题),直至达到最小子问题(空子树)时终止。
- 子问题是独立的:左子树和右子树是相互独立的,它们之间没有交集。在构建左子树时,我们只需关注中序遍历和前序遍历中与左子树对应的部分。右子树同理。
- 子问题的解可以合并:一旦得到了左子树和右子树(子问题的解),我们就可以将它们链接到根节点上,得到原问题的解。
如何划分子树
根据以上分析,这道题可以使用分治来求解,但如何通过前序遍历 preorder
和中序遍历 inorder
来划分左子树和右子树呢?
根据定义,preorder
和 inorder
都可以划分为三个部分。
- 前序遍历:
[ 根节点 | 左子树 | 右子树 ]
,例如上图的树对应[ 3 | 9 | 2 1 7 ]
。 - 中序遍历:
[ 左子树 | 根节点 | 右子树 ]
,例如上图的树对应[ 9 | 3 | 1 2 7 ]
。
以上图数据为例,我们可以通过下图所示的步骤得到划分结果。
- 前序遍历的首元素 3 是根节点的值。
- 查找根节点 3 在
inorder
中的索引,利用该索引可将inorder
划分为[ 9 | 3 | 1 2 7 ]
。 - 根据
inorder
的划分结果,易得左子树和右子树的节点数量分别为 1 和 3 ,从而可将preorder
划分为[ 3 | 9 | 2 1 7 ]
。
基于变量描述子树区间
根据以上划分方法,我们已经得到根节点、左子树、右子树在 preorder
和 inorder
中的索引区间。而为了描述这些索引区间,我们需要借助几个指针变量。
- 将当前树的根节点在
preorder
中的索引记为 。 - 将当前树的根节点在
inorder
中的索引记为 。 - 将当前树在
inorder
中的索引区间记为 。
如下表所示,通过以上变量即可表示根节点在 preorder
中的索引,以及子树在 inorder
中的索引区间。
表
根节点在 preorder 中的索引 |
子树在 inorder 中的索引区间 |
|
---|---|---|
当前树 | ||
左子树 | ||
右子树 |
请注意,右子树根节点索引中的 的含义是“左子树的节点数量”,建议结合下图理解。
代码实现
为了提升查询 的效率,我们借助一个哈希表 hmap
来存储数组 inorder
中元素到索引的映射:
1 | def dfs( |
1 | def build_tree(preorder: list[int], inorder: list[int]) -> TreeNode | None: |
下图展示了构建二叉树的递归过程,各个节点是在向下“递”的过程中建立的,而各条边(引用)是在向上“归”的过程中建立的。
每个递归函数内的前序遍历 preorder
和中序遍历 inorder
的划分结果如下图所示。
设树的节点数量为 ,初始化每一个节点(执行一个递归函数 dfs()
)使用 时间。因此总体时间复杂度为 。
哈希表存储 inorder
元素到索引的映射,空间复杂度为 。在最差情况下,即二叉树退化为链表时,递归深度达到 ,使用 的栈帧空间。因此总体空间复杂度为 。
前序和后序构建树(没有中序构建出的树就是不唯一)
给定一棵二叉树的前序遍历 preorder
和后序遍历 postorder
,请从中构建二叉树,返回二叉树的根节点。假设二叉树中没有值重复的节点。
分析
前序遍历为:(根节点)(前序遍历左子树)(前序遍历右子树)
后序遍历为:(后序遍历左子树)(后序遍历右子树)(根节点)
例如,二叉树序列化表示为[1,2
,3,4,5,6,7],前序遍历为[1]+[2
,4,5]+[3,6,7],后序遍历为[4,5,2
]+[6,7,3]+[1]
如果我们知道左子树有多少节点,可以分别对左子树和右子树进行分组,并递归生成树的每个子树
算法
令左子树有L个节点,左子树的根节点为pre[1]
,同时出现在后序遍历左子树
的最后,所以pre[1] = post[L-1]
,所以左子树节点个树L = post.index(pre[1])+1
(ps:左子树根节点为上面的2
,这里的2
作为根节点的左子节点,在前序遍历中出现在左子树的第一个,那么在后序遍历中一定是左子树的最后一个,因为在后序遍历中左子树的根符合左、右、根
,就是在左子树的最后一个(左
中的左、右、根
其中的根就在最后),所以可以找到后序遍历中的2
作为分界点。2,4,5
对应4, 5, 2
)
在递归步骤中,左子树由前序pre[1:L+1]
和后序post[0:L]
重新分支,右子树由pre[L+1:N]
和pre[L:N-1]
重新分支。(N为最后一个元素的索引)
1 | def construct(self, pre, post): |
总结
无论是前中序还是前后序构造二叉树,关键点都是划分左子树和右子树
前中序(中序中根节点有意义,左边为左子树区间,右边为右子树区间)
通过左子树根节点、左子树在中序的索引区间和右子树根节点、右子树在中序的索引区间来划分左右子树
左子树在中序的索引区间为[l,m-1]
,右子树在中序的索引区间为[m+1,r]
(m为根节点在中序的位置)
前后序(后序中根节点在末尾,没有意义,直接找左子树的根节点,在左子树序列的末尾)
通过左子树根节点的位置和左子树节点数量(通过左子树在后序中的位置确定)来划分左右子树
1.左子树区间划分
前序中左子树根节点
到左子树节点数量对应索引+1
为左子树区间pre[1:L+1]
([2,4,5]
),后序中从头
到左子树根节点
为左子树区间post[0:L]
([4,5,2]
),因为后序遍历就是左、右、根
左子树对应例子中前序的pre[1:L+1]和后序的post[0:L]
2.右子树区间划分
前序中左子树节点数量对应索引+1
到最后一个元素
为右子树区间pre[L+1:]
([3,6,7]
),后序中从左子树根节点
到倒数第二个元素
(去掉最后一个元素为根节点)为右子树区间post[L:-1]
([6,7,3]
)