Jeff数据结构与算法收官之战:三天结束战斗!

   日期:2020-08-27     浏览:142    评论:0    
核心提示:平衡二叉树:前提是有序的二叉树,它的左右子树的高相差不超过1,它的所有的子树也要满足这个要求。如果一个有序二叉树呈单支状(接近单支),它的效率接近链表,因此只有达到平衡时它的效率才最高。由于节点的位置受值的影响,因此只能进行调整,而不能强行修改。二叉树不平衡的基础原因: x y / \\ / \\ y t1 以为轴向右旋转 z x /

平衡二叉树:

前提是有序的二叉树,它的左右子树的高相差不超过1,它的所有的子树也要满足这个要求。
如果一个有序二叉树呈单支状(接近单支),它的效率接近链表,因此只有达到平衡时它的效率才最高。
由于节点的位置受值的影响,因此只能进行调整,而不能强行修改。

二叉树不平衡的基础原因:
      x                            y 
     / \                         /   \
    y   t1  以为轴向右旋转       z     x
   / \                         / \   / \
  Z   t2                      t3 t4 t2 t1
 / \
t4  t3

  x                                  y
 / \                               /   \
t1  y                             x     z
   / \      心y为轴向左旋转       / \   / \
  t2  z                         t1 t2 t3 t4
     / \                             
    t3  t4

      x                 x                z
     / \               / \             /   \
    y   t1            z   t1          y     x
   / \               / \             / \   / \
  t4  z             y   t2          t4 t3 t2 t1
     /  \          / \
    t3   t2       t4  t3
以z为轴向左旋转    以z为轴向右旋转    最终达到平衡

    x                 x                   z
   / \               / \                /   \
  t1  y             t1  z              x     y
     / \               / \            / \   / \
    z  t4             t2  y          t1 t2 t3  t4
   / \                   / \
  t2  t3                t3 t4
以z为轴向右旋转    心z为轴向左旋转

红黑树:

也一种自平衡的二叉树,它不是根据子树的高度来调整平衡的,而是给节点设置一个颜色,来达到平衡。
优点:插入与删除的效率,比AVL树要高。
缺点:没有AVL均匀,查找效率没AVL树高。

图(Graph)型结构:

什么图型结构:由顶点的有穷且非空和顶点之间边的集合.
通常表示:G(V,E),G表示一个图,V是图中顶点集合(元素),E是图中边(元素之间的关系)的集合。

无向图:

  边用(A,B)方式表示,点与点之间是互通的。
  在无向图中,任意两个顶点之间都有边,该图称为无向完全图,则含有n个顶点的无向完全图有,n*(n-1)/2条边。

有向图:
边用<A,B>方式表示,仅仅是A到到B点,有向图的边也叫弧,A是弧尾,B是弧头。
在有向图中,任意两个顶点之间都方向相反的两条弧,这种图叫有向完全图,则含有n个顶点的有向完全图有,n*(n-1)。
注意:不存在顶点到自身的边,且一条边不重复出现,这种图叫简单图,数据结构中只研究简单图。

图的点多边少的图叫稀疏图,反之的叫稠密图,图的点与点之间边带数据,这些数据叫作边的权重,带权重的图被称为网。

依附于顶点的边的数量叫作顶的度,有向图双分为出度(从顶出的的弧的数量)和入度(指向顶点的弧的数量)。

路径:顶点到顶点经过的边叫路径,边的数量叫路径的长度。

第一个顶点到最后一个顶的路径是相同的,这种路径叫回路或者环。
序列顶点中不重复出现的路径称为简单路径,除了第一个顶点和最后一个顶点,其余顶点不重复出现的回路叫简单回路。

如果顶点V到顶点V1有路径,则称V和V1是连通的,如果图中和任意顶点之间是连通的,则称图为连通图,如果一个图中有n个顶点那么至少需要n-1条边才能达到连通图,仅需要n-1边的连通叫生成树,如果再配合上权重,代价最的叫最小生成树。

树的存储结构:

阾接矩阵:

  用一个一维数组来存储n个顶点,用一个n*n二维数组来存储边。
  char V[n] = {A,B,C,D,E,F,G};
        A  B  C  D  E  F  G
     A [0][0][0][1][1][0][0]
     B [0][0][0][0][0][0][0]
     C [0][0][0][0][0][0][0]
     D [1][0][0][0][0][0][0]
     E [0][0][0][0][0][0][0]
     F [0][0][0][0][0][0][0]
     G [0][0][0][0][0][0][0]
     二维数组中E[i][j]的值为1,则表示项V[i],到顶点V[j]有边。
     注意:由于不存在自己到自己的边,主对角线上的值为假。
     如果存储的是无向图则二维数组中的值沿主对角线对称,可以压缩为一维数组(参看矩阵压缩)。

阾接矩阵的优点是可以方便计算顶点的入度和出度,但缺点是当图是稀疏图时,会非常浪费存储空间。

阾接表:

  边:
     顶点下标
     下一条边的地址
  顶点:
     数据
     指向第一条边的指针
  图:
     由顶点组成的数组            
     顶点数量cnt
  优点:可以节约存储空间,计算入度麻烦。

十字链表:

  边:
     弧尾下标
     弧头下标
     指向相同弧尾的下一条边
     指向相同弧头的下一条边

  顶点:
     数据
     指向第一条边的指针
     指向入度的边
  图:
     由顶点组成的数组            
     顶点数量cnt

阾接多重表:

  是一种专门存储无向图的一种结构。
  边:
     i,j 两个互相依附的顶点的下标
     inext 指向下一个依附i项点的边
     jnext 指向下一个依附j项点的边

  顶点:
     数据 
     指向与顶点有关系的一条边。
     
  图:
     由顶点组成的数组。
     顶点数量

算法:

输入: 算法具有0个或多个输入
输出: 算法至少有1个或多个输出
有穷性: 算法在有限的步骤之后会自动结束而不会无限循环,并且每一个步骤可以在可接受的时间内完成
确定性:算法中的每一步都有确定的含义,不会出现二义性
可行性:算法的每一步都是可行的,也就是说每一步都能够执行有限的次数完

如果评价一个算法:
时间复杂度:由于计算机的性能不同,无法准确统计出算法执行所需要的时间。
因此我们用算法执行的次数来代表算法的时间复杂度,O(公式),一般忽略常数。

  常见的时间复杂度:
     // O(1)
     printf("%d",i); 
     // O(logn)
     for(int i=n; i>=0; i=i/2)
     {
        printf("%d",i);
     }
     // O(n)
     for(int i=0; i<n; i++)
     {
        printf("%d",i);
     }
     // O(nlogn)
     for(int j=0; j<n; j++)
     {
        for(int i=n; i>=0; i=i/2)
        {
           printf("%d",i);
        }
     }
     // O(n^2)
     for(int i=0; i<n; i++)
     {
        for(int j=0; j<n; j++)
        {
           printf("%d",i*j);
        }
     }

查找算法:

顺序查找:

  对待查找的数据没有要求,时间复杂度: O(n)

二分查找:

  对待查找的数据必须有序,时间复杂度: O(logn)

块查找:

  是一种数据处理的思想,不是特定的算法,当数据量过多时,可以先把数据进行分块处理,然后再进行查找,例如英语词典。

哈希查找:

  数据 经过哈希函数 计算出数据在哈希表中的位置,然后标记,方便之后的查找,它的时间复试度最快能达到:O(1)。
  但是该算法有很大局限性,不适合浮点型、字符串型数据,需要额外的存储空间,空间复杂度高,是一种典型的用空间换取时间的算法。

哈希函数设计方法:

     直接定址法:把数据直接当作数组的下标。
     数字分析法:分析数据的特点来设计哈希,常用的方法就是找到最大值与最小值,最大值-最小值+1来确定哈希表的长度,数据-最小值访问哈希表。

排序算法:

冒泡:数据左右进行比较,把最大的数据交换到最后,特点是该算法对数据的有序性敏感,在排序过程中可以立即发现已经完成。

选择:假定最开始的位置是最小值并记录下标min,然后与后面的数据进行比较,如果有比以min为下标的数据小的则min的更新,最后如果min的如果发生改变,则交换min与最开始位置的数据,虽然时间复杂度挺高的,但数据交换的次数比较小,因此实际运行速度并不慢(数据交换比数据比较耗时)。

插入:把数据看作两部分,一分部是有序,把剩余的数据逐个插入进行,适合对已经排序后的数据,新增数据并排序。

希尔:是插入排序的增加版,由于插入排序时,数据移动的速度比较发慢,所以增加了增量的概念,以此来提高排序速度。

快速:找到一个标杆,一面从左找比标杆大的数据,找到后把放在标杆的右边,另一个从右边找比标杆小的数据,找到后把放在标杆的左边,最终标杆左边的数据都比它小,右边的数据都比它大,这样就整体有序,然后按同样的方法排序标杆左边的数据和标杆右边的数据。

快速:通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。

归并:建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为2-路归并。

堆:堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。

计数:计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

桶:桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。桶排序 (Bucket sort)的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排)。

基数:属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或binsort,顾名思义,它是透过键值的部份资讯,将要排序的元素分配至某些“桶”中,藉以达到排序的作用。

 
打赏
 本文转载自:网络 
所有权利归属于原作者,如文章来源标示错误或侵犯了您的权利请联系微信13520258486
更多>最近资讯中心
更多>最新资讯中心
0相关评论

推荐图文
推荐资讯中心
点击排行
最新信息
新手指南
采购商服务
供应商服务
交易安全
关注我们
手机网站:
新浪微博:
微信关注:

13520258486

周一至周五 9:00-18:00
(其他时间联系在线客服)

24小时在线客服