前言 标准的STL关联式容器set(集合)和map(映射表)两大类,在观念上它们类似于数据库(实际则还要简单):每笔数据(每个元素)都有一个键值(key)和一个实值(value)。当元素插入到关联式容器时,就会以某种特定规则将这个元素放在适当的位置。因此关联式容器没有所谓的头尾的说法,所以就没有一些push_back()、push_font()等等这样的操作。
一般而论,关联式容器的内部结构都是一个balanced binary tree(平衡二叉树),用以寻求最高的搜索效率。当然,对于平衡二叉树来说,它也是存在许多的分支。但是其中广泛运用于STL关联式容器的底层结构的主要是RB-Tree,作为关联式容器的核心,我们很是有必要来深入探索一下它。
二叉搜索树 在了解红黑树之前,大概还需要一些基本的知识准备。树作为一种十分基础的数据结构,几乎所有的操作系统都将文件存放在树状结构。树这种数据结构也具有许多的分支,如文件压缩所采用的哈夫曼树,数据库中使用的B-Tree等。对于RB-Tree来说,它就是属于二叉搜索树中的一种。
平衡二叉搜索树 它是一种结构平衡的二叉树,其每个节点的左右两个高度差不超过一个二叉树。可以在O(logn)时间内完成插入、删除操作。
自平衡二叉搜索树 AVL树是最早发明的自平衡二叉搜索树。在AVL树中,任一节点对应的两棵子树的最大高度差为1,因此它也被称为高度平衡树。查找、插入和删除在平均和最坏情况下的时间复杂度都是O(logn)。增加和删除元素的操作则可能需要借由一次或多次树旋转,以实现树的重新平衡。
那么对应这四种情况,我们也提供了两种解决方法来修复这些插入而导致的不平衡。
RB-Tree是另一个被广泛使用的平衡二叉搜索树,它的平衡条件虽然不同于AVL-Tree,但是也同样使用了单旋转与双旋转修正操作,这些在RB-Tree的解析中也详细解析。
RB-Tree RB-Tree不仅是一个二叉搜索树,它还必须满足以下的规则:
如下就是一个标准的红黑树:
节点设计 RB-Tree有红黑两种颜色,并且具有左右子节点,我们可以很容易的设计出其结构风貌。具体STL中源码中如下:__rb_tree_node_base 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 struct  __rb_tree_node_base {   typedef  __rb_tree_color_type color_type;	   typedef  __rb_tree_node_base* base_ptr;	   color_type color; 	   base_ptr parent;		   base_ptr left;		   base_ptr right;		        static  base_ptr minimum (base_ptr x)     {    while  (x->left != 0 ) x = x->left;     return  x;   }        static  base_ptr maximum (base_ptr x)     {    while  (x->right != 0 ) x = x->right;     return  x;   } }; 
__rb_tree_node 
1 2 3 4 5 6 template  <class  Value >struct  __rb_tree_node  :public  __rb_tree_node_base	{   typedef  __rb_tree_node<Value>* link_type;   Value value_field;	 }; 
红黑树的节点设计很是巧妙,将节点与数据分开定义。这种手法与list结构很是类似,__rb_tree_node_base定义了指针,__rb_tree_node定义了继承了前者,并增加了数据,这样就形成了一个完整的节点。
迭代器设计 迭代器中increment与decrement函数主要实现的就是++与–,即迭代器中的前进与后退操作。__rb_tree_base_iterator 
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 struct  __rb_tree_base_iterator {   typedef  __rb_tree_node_base::base_ptr base_ptr;   typedef  bidirectional_iterator_tag iterator_category;	   typedef  ptrdiff_t  difference_type;   base_ptr node;	             void  increment ()     {           if  (node->right != 0 ) {       node = node->right;                while  (node->left != 0 )         node = node->left;     }            else  {       base_ptr y = node->parent;                while  (node == y->right) {         node = y;         y = y->parent;       }       if  (node->right != y)         node = y;     }   }             void  decrement ()     {           if  (node->color == __rb_tree_red && node->parent->parent == node)       node = node->right;            else  if  (node->left != 0 ) {                base_ptr y = node->left;                while  (y->right != 0 )         y = y->right;       node = y;     }            else  {                base_ptr y = node->parent;                while  (node == y->left) {         node = y;         y = y->parent;       }       node = y;     }   } }; 
红黑树的迭代器,通过继承 __rb_tree_base_iterator重载++与–操作(通过调用 increment()与decrement())
构造与析构 在深入到构造之前,还需要先了解一下基本类型定义。对于红黑树来说,它也有自己的空间配置器,其中也囊括了各种类型定义,维护整棵红黑树的三笔数据node_count 记录树的大小、header这是头节点,非根节点,但是头节点指向根节点以及key_compare这个仿函数。其类型定义源码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 template  <class  Key , class  Value , class  KeyOfValue , class  Compare , class  Alloc  =class  rb_tree  {protected :  typedef  void * void_pointer;   typedef  __rb_tree_node_base* base_ptr;	   typedef  __rb_tree_node<Value> rb_tree_node;	   typedef  simple_alloc<rb_tree_node, Alloc> rb_tree_node_allocator;	   typedef  __rb_tree_color_type color_type; public :	   typedef  Key key_type;   typedef  Value value_type;   typedef  value_type* pointer;   typedef  const  value_type* const_pointer;   typedef  value_type& reference;   typedef  const  value_type& const_reference;   typedef  rb_tree_node* link_type;   typedef  size_t  size_type;   typedef  ptrdiff_t  difference_type; protected :  size_type node_count;    link_type header;  	   Compare key_compare;	 public :	   typedef  __rb_tree_iterator<value_type, reference, pointer> iterator;   typedef  __rb_tree_iterator<value_type, const_reference, const_pointer>           const_iterator; #ifdef  __STL_CLASS_PARTIAL_SPECIALIZATION   typedef  reverse_iterator<const_iterator> const_reverse_iterator;   typedef  reverse_iterator<iterator> reverse_iterator; #else     typedef  reverse_bidirectional_iterator<iterator, value_type, reference,                                          difference_type>           reverse_iterator;   typedef  reverse_bidirectional_iterator<const_iterator, value_type,                                          const_reference, difference_type>           const_reverse_iterator;   ... }; 
对于红黑树来说,它的构造存在两种方式:一种是以现有的RB-Tree复制一个新的RB-Tree,另一个就是产生一棵空树,如下图所示:
元素插入与删除 在红黑树中,元素的插入与删除就要涉及到红黑树的调整了。不过对于红黑树而言,调整也就不过两种方式:左旋、右旋。那么为什么需要这些操作呢?这是由于在元素的插入与删除过程中,可能会违背红黑树的性质,因而需要它们来修复平衡。其实,如果理解左旋,右旋也就没有什么问题了,毕竟左右树是对称的。
左旋操作 对于左旋操作大致需要六个步骤,这里需要设有一个前提:这里假设x的右孩子为y,这样就可以开始了:
右旋操作 对于右旋操作大致操作也是一样的,这里也需要设有一个前提:这里假设y的左孩子为x这样就可以开始了:
元素插入 一般而言,RB-Tree可以分为三个步骤:
但是,正如之前所说,插入会导致红黑树的性质被破坏。所以对应的我们除了使用左旋或右旋外,我们还应对不符合性质的节点进行染色。
  前提:节点x的父节点x->parent是其祖父节点x->parent->parent的左孩子
元素操作 在这里,仅对元素的插入与搜索进行一个深入讨论。
基本元素操作 红黑树中,它所需的基本元素有很多。其中就包括:左节点、右节点、父节点、实值、键值、颜色等,具体到源码,如下所示:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 template  <class  Key , class  Value , class  KeyOfValue , class  Compare , class  Alloc  =class  rb_tree  {	... protected :  link_type& root ()  const   { return  (link_type&) header->parent; }		   link_type& leftmost ()  const   { return  (link_type&) header->left; }		   link_type& rightmost ()  const   { return  (link_type&) header->right; }	 	 	   static  link_type& left (link_type x)  return  (link_type&)(x->left); }   static  link_type& right (link_type x)  return  (link_type&)(x->right); }   static  link_type& parent (link_type x)  return  (link_type&)(x->parent); }   static  reference value (link_type x)  return  x->value_field; }	   static  const  Key& key (link_type x)  return  KeyOfValue ()(value (x)); }   static  color_type& color (link_type x)  return  (color_type&)(x->color); }   static  link_type& left (base_ptr x)  return  (link_type&)(x->left); }   static  link_type& right (base_ptr x)  return  (link_type&)(x->right); }   static  link_type& parent (base_ptr x)  return  (link_type&)(x->parent); }   static  reference value (base_ptr x)  return  ((link_type)x)->value_field; }   static  const  Key& key (base_ptr x)  return  KeyOfValue ()(value (link_type (x)));}   static  color_type& color (base_ptr x)  return  (color_type&)(link_type (x)->color); } 	   static  link_type minimum (link_type x)       return  (link_type)  __rb_tree_node_base::minimum (x);   }   	   static  link_type maximum (link_type x)       return  (link_type) __rb_tree_node_base::maximum (x);   } public :                                   Compare key_comp ()  const   { return  key_compare; }      iterator begin ()   { return  leftmost (); }   const_iterator begin ()  const   { return  leftmost (); }      iterator end ()   { return  header; }   const_iterator end ()  const   { return  header; }   reverse_iterator rbegin ()   { return  reverse_iterator (end ()); }   const_reverse_iterator rbegin ()  const   {     return  const_reverse_iterator (end ());   }   reverse_iterator rend ()   { return  reverse_iterator (begin ()); }   const_reverse_iterator rend ()  const   {     return  const_reverse_iterator (begin ());   }   bool  empty ()  const  return  node_count == 0 ; }		   size_type size ()  const   { return  node_count; }			   size_type max_size ()  const   { return  size_type (-1 ); }   ... }; 
元素插入 红黑树提供了两种插入方式:insert_unique() 与 insert_equal()。前者表示被插入的键值在整棵树中必须唯一,后者则表示被插入节点的键值可以在整棵树中可以重复。具体源码解析如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 template  <class  Key , class  Value , class  KeyOfValue , class  Compare , class  Alloc >typename  rb_tree<Key, Value, KeyOfValue, Compare, Alloc>::iteratorrb_tree<Key, Value, KeyOfValue, Compare, Alloc>:: __insert(base_ptr x_, base_ptr y_, const  Value& v) { 	   link_type x = (link_type) x_;   link_type y = (link_type) y_;   link_type z;   if  (y == header || x != 0  || key_compare (KeyOfValue ()(v), key (y))) {     z = create_node (v);	     left (y) = z;                     if  (y == header) {       root () = z;       rightmost () = z;     }     else  if  (y == leftmost ())       leftmost () = z;              }   else  {     z = create_node (v);     right (y) = z;     if  (y == rightmost ())       rightmost () = z;             }   parent (z) = y;   left (z) = 0 ;   right (z) = 0 ;   __rb_tree_rebalance(z, header->parent);   ++node_count;   return  iterator (z); } template  <class  Key , class  Value , class  KeyOfValue , class  Compare , class  Alloc >typename  rb_tree<Key, Value, KeyOfValue, Compare, Alloc>::iteratorrb_tree<Key, Value, KeyOfValue, Compare, Alloc>::insert_equal (const  Value& v) {   link_type y = header;   link_type x = root ();   while  (x != 0 ) {     y = x; 	     x = key_compare (KeyOfValue ()(v), key (x)) ? left (x) : right (x);   }   return  __insert(x, y, v); } template  <class  Key , class  Value , class  KeyOfValue , class  Compare , class  Alloc >pair<typename  rb_tree<Key, Value, KeyOfValue, Compare, Alloc>::iterator, bool > rb_tree<Key, Value, KeyOfValue, Compare, Alloc>::insert_unique (const  Value& v) {   link_type y = header;   link_type x = root ();   bool  comp = true ;   while  (x != 0 ) {     y = x; 	     comp = key_compare (KeyOfValue ()(v), key (x));     x = comp ? left (x) : right (x);   }      iterator j = iterator (y);      if  (comp)     if  (j == begin ())        return  pair<iterator,bool >(__insert(x, y, v), true );     else         --j;     if  (key_compare (key (j.node), KeyOfValue ()(v)))     return  pair<iterator,bool >(__insert(x, y, v), true );     return  pair<iterator,bool >(j, false ); } 
元素搜索 作为二叉搜索树的红黑树,元素的搜索可是它的拿手好戏。以下是它的源码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 template  <class  _Key , class  _Value , class  _KeyOfValue ,          class  _Compare , class  _Alloc > typename  _Rb_tree<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::const_iterator_Rb_tree<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::find (const  _Key& __k) const  {   _Link_type __y = _M_header;    _Link_type __x = _M_root();    while  (__x != 0 ) {     if  (!_M_key_compare(_S_key(__x), __k))       __y = __x, __x = _S_left(__x);     else        __x = _S_right(__x);   }   const_iterator __j = const_iterator (__y);   return  (__j == end () || _M_key_compare(__k, _S_key(__j._M_node))) ?     end () : __j; } template  <class  _Key , class  _Value , class  _KeyOfValue ,          class  _Compare , class  _Alloc > typename  _Rb_tree<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::size_type_Rb_tree<_Key,_Value,_KeyOfValue,_Compare,_Alloc>   ::count (const  _Key& __k) const  {   pair<const_iterator, const_iterator> __p = equal_range (__k);   size_type __n = 0 ;   distance (__p.first, __p.second, __n);   return  __n; } 
红黑树总结 优点:
缺点:
总结:实际应用中,若搜索的次数远远大于插入和删除,那么选择AVL,如果搜索,插入删除次数几乎差不多,应该选择RB。