Walk by faith code, hack, curious

二叉树

 

  在计算机科学中,二叉树是每个结点最多有两个子树的有序树。

通常根的子树被称作左子树left
subtree
)和右子树right
subtree
。二叉树常被用作二叉查找树和二叉堆。

  二叉树的每个结点至多只有二棵子树(不存在度大于2的结点),二叉树的子树有左右之分,次序不能颠倒。二叉树的第i层至多有2^(i −
1)个结点;深度为k的二叉树至多有2^k −
1个结点(根结点的深度为1);对任何一棵二叉树T,如果其终端结点数为n0,度为2的结点数为n2,则n0 = n2 + 1。

  树和二叉树的2个主要差别:

  1. 树中结点的最大度数没有限制,而二叉树结点的最大度数为2;

  2. 树的结点无左、右之分,而二叉树的结点有左、右之分。……

  树是一种重要的非线性数据结构,直观地看,它是数据元素(在树中称为结点)按分支关系组织起来的结构,很象自然界中的树那样。树结构在客观世界中广泛存在,如人类社会的族谱和各种社会组织机构都可用树形象表示。树在计算机领域中也得到广泛应用,如在编译源程序如下时,可用树表示源源程序如下的语法结构。又如在数据库系统中,树型结构也是信息的重要组织形式之一。一切具有层次关系的问题都可用树来描述。

 

一、树的概述

  树结构的特点是:它的每一个结点都可以有不止一个直接后继,除根结点外的所有结点都有且只有一个直接前趋。以下具体地给出树的定义及树的数据结构表示。

  

(一)树的定义

 

  树是由一个或多个结点组成的有限集合,其中:

  ⒈必有一个特定的称为根(ROOT)的结点;

  ⒉剩下的结点被分成n>=0个互不相交的集合T1、T2、……Tn,而且,
这些集合的每一个又都是树。树T1、T2、……Tn被称作根的子树(Subtree)。

  树的递归定义如下:(1)至少有一个结点(称为根)(2)其它是互不相交的子树

  1.树的度——也即是宽度,简单地说,就是结点的分支数。以组成该树各结点中最大的度作为该树的度,如上图的树,其度为3;树中度为零的结点称为叶结点或终端结点。树中度不为零的结点称为分枝结点或非终端结点。除根结点外的分枝结点统称为内部结点。

  2.树的深度——组成该树各结点的最大层次,如上图,其深度为4;

  3.森林——指若干棵互不相交的树的集合,如上图,去掉根结点A,其原来的二棵子树T1、T2、T3的集合{T1,T2,T3}就为森林;

  4.有序树——指树中同层结点从左到右有次序排列,它们之间的次序不能互换,这样的树称为有序树,否则称为无序树。

  5.树的表示

  树的表示方法有许多,常用的方法是用括号:先将根结点放入一对圆括号中,然后把它的子树由左至右的顺序放入括号中,而对子树也采用同样的方法处理;同层子树与它的根结点用圆括号括起来,同层子树之间用逗号隔开,最后用闭括号括起来。如上图可写成如下形式:

  (A(B(E(K,L),F),C(G),D(H(M),I,J)))

  

5. 2 二叉树

  

  1.二叉树的基本形态:

  二叉树也是递归定义的,其结点有左右子树之分,逻辑上二叉树有五种基本形态:

  (1)空二叉树——(a);

  (2)只有一个根结点的二叉树——(b);

  (3)只有右子树——(c);

  (4)只有左子树——(d);

  (5)完全二叉树——(e)

  注意:尽管二叉树与树有许多相似之处,但二叉树不是树的特殊情形。

  2.两个重要的概念:

  (1)完全二叉树——只有最下面的两层结点度小于2,并且最下面一层的结点都集中在该层最左边的若干位置的二叉树;

  (2)满二叉树——除了叶结点外每一个结点都有左右子女且叶结点都处在最底层的二叉树,。

  3.二叉树的性质

  (1) 在二叉树中,第i层的结点总数不超过2^(i-1);

  (2)
深度为h的二叉树最多有2^h-1个结点(h>=1),最少有h个结点;

  (3) 对于任意一棵二叉树,如果其叶结点数为N0,而度数为2的结点总数为N2,

  则N0=N2+1;

  (4) 具有n个结点的完全二叉树的深度为int(log2n)+1

  (5)有N个结点的完全二叉树各结点如果用顺序方式存储,则结点之间有如下关系:

  若I为结点编号则
如果I<>1,则其父结点的编号为I/2;

  如果2*I<=N,则其左儿子(即左子树的根结点)的编号为2*I;若2*I>N,则无左儿子;

  如果2*I+1<=N,则其右儿子的结点编号为2*I+1;若2*I+1>N,则无右儿子。

  (6)给定N个节点,能构成h(N)种不同的二叉树。

  h(N)为卡特兰数的第N项。h(n)=C(n,2*n)/(n+1)。

  4.二叉树的存储结构:

  (1)顺序存储方式

  type node=record

  data:datatype

  l,r:integer;

  end;

  var tr:array[1..n] of node;

  (2)链表存储方式,如:

  type btree=^node;

  node=record

  data:datatye;

  lchild,rchild:btree;

  end;

  5.普通树转换成二叉树:凡是兄弟就用线连起来,然后去掉父亲到儿子的连线,只留下父母到其第一个子女的连线。

  二叉树很象一株倒悬着的树,从树根到大分枝、小分枝、直到叶子把数据联系起来,这种数据结构就叫做树结构,简称树。树中每个分叉点称为结点,起始结点称为树根,任意两个结点间的连接关系称为树枝,结点下面不再有分枝称为树叶。结点的前趋结点称为该结点的”双亲”,结点的后趋结点称为该结点的”子女”或”孩子”,同一结点的”子女”之间互称”兄弟”。

  二叉树:二叉树是一种十分重要的树型结构。它的特点是,树中的每个结点最多只有两棵子树,即树中任何结点的度数不得大于2。二叉树的子树有左右之分,而且,子树的左右次序是重要的,即使在只有一棵子树的情况下,也应分清是左子树还是右子树。定义:二叉树是结点的有限集合,这个集合或是空的,或是由一个根结点和两棵互不相交的称之为左子树和右子树的二叉树组成。

  (三)完全二叉树

  对满二叉树,从第一层的结点(即根)开始,由下而上,由左及右,按顺序结点编号,便得到满二叉树的一个顺序表示。据此编号,完全二叉树定义如下:一棵具有n个结点,深度为K的二叉树,当且仅当所有结点对应于深度为K的满二叉树中编号由1至n的那些结点时,该二叉树便是完全二叉树。图4是一棵完全二叉树。

三、二叉树遍历

  遍历是对树的一种最基本的运算,所谓遍历二叉树,就是按一定的规则和顺序走遍二叉树的所有结点,使每一个结点都被访问一次,而且只被访问一次。由于二叉树是非线性结构,因此,树的遍历实质上是将二叉树的各个结点转换成为一个线性序列来表示。

  设L、D、R分别表示遍历左子树、访问根结点和遍历右子树,
则对一棵二叉树的遍历有三种情况:DLR(称为先根次序遍历),LDR(称为中根次序遍历),LRD (称为后根次序遍历)。

  (1)先序遍历

  访问根;按先序遍历左子树;按先序遍历右子树

  (2)中序遍历

  按中序遍历左子树;访问根;按中序遍历右子树

  (3)后序遍历

  按后序遍历左子树;按后序遍历右子树;访问根