走进科学之计算机网络-数据链路层-硬核扫盲
继续硬核学习计算机网络系列!
本文承接:
三言两语轻松计算机网络入门
走进科学之-计算机网络物理层-硬核扫盲
文章目录
- 走进科学之计算机网络-数据链路层-硬核扫盲
- 数据链路层涉及的基本概念
- 三个基本问题
- 点对点信道的数据链路层PPP
- 广播信道的数据链路层
- 以太网及其扩展
- 以太网的扩展与优化历程
本文的聚焦点主要在于数据链路层间数据的传输,事实上,在数据在两个节点间的传输,应该是发送端从应用层到物理层,中间以物理再到网络层,网络层到物理层,接收端从物理层到应用层这个过程的
数据链路层涉及的基本概念
数据链路层的信道类型
数据链路层使用的信道主要有以下两种类型:
- 点对点信道:这种信道使用一对一的点对点通信方式
- 广播信道:这种信道使用一对多的广播通信方式,因此过程比较复杂,广播信道上连接的主机很多,因此必须使用专用的共享信道协议来协调这些主机的数据发送
链路与数据链路
链路(link):是一条点到点的物理线路段,中间没有任何其他的交换结点。
一条链路只是一条通路的一个组成部分。数据链路(data link) 除了物理线路外,还必须有通信协议来控制这些数据的传输。若把实现这些协议的硬件和软件加到链路上,就构成了数据链路。
现最常用的方法是使用适配器(即网卡)来实现这些协议的硬件和软件
帧
数据链路层传送的是帧
三个基本问题
封装成帧
封装成帧(framing)就是在一段数据的前后分别添加首部和尾部,然后就构成了一个帧,首部和尾部的一个重要作用就是进行帧定界
试想:帧还未发送完,发送端出了问题,只能重发该帧,接收端却收到了前面的“半截子帧”,它会抛弃吗?
答案当然是会的,在帧首位都会有开始符和结束符,如果接收端没有接收到结束符,自然会认定接收到的是一个无效帧
但是,如果数据段中有一段数据与结束符是一样的呢?接收端读取到的时候,判定是一个结束符,那这个帧一样是无效的,如何做?
解决方案-字节填充法
发送端的数据链路层在数据中出现控制字符“SOH”或“EOT”的前面插入一个转义字符“ESC”(其十六进制编码是 1B)
接收端的数据链路层在将数据送往网络层之前删除插入的转义字符
如果转义字符也出现数据当中,那么应在转义字符前插入一个转义字符。当接收端收到连续的两个转义字符时,就删除其中前面的一个
差错检验
传输过程中可能会产生比特差错:1 可能会变成 0 而 0 也可能变成 1
在一段时间内,传输错误的比特占所传输比特总数的比率称为误码率 BER (Bit Error Rate),误码率与信噪比有很大的关系
为了保证数据传输的可靠性,在计算机网络传输数据时,必须采用各种差错检测措施
循环冗余检验CRC
在数据链路层传送的帧中,广泛使用了循环冗余检验 CRC 的检错技术
在发送端,先把数据划分为组。假定每组 k 个比特。假设待传送的一组数据 M = 101001(现在 k = 6)。我们在 M 的后面再添加供差错检测用的 n 位冗余码一起发送
收端对收到的每一帧进行 CRC 检验
若得出的余数 R = 0,则判定这个帧没有差错,就接受(accept)
若余数 R !=0,则判定这个帧有差错,就丢弃在数据后面添加上的冗余码称为帧检验序列 FCS (Frame Check Sequence)
具体计算这里就不展开了,后面如果写到计算机组成原理的博文,会详细说明
点对点信道的数据链路层PPP
点对点信道的数据链路层,数据的传输主要基于PPP协议
现在全世界使用得最多的数据链路层协议也是点对点协议 PPP (Point-to-Point Protocol)。
用户使用拨号电话线接入因特网时,一般都是使用 PPP 协议
PPP协议应该满足的要求:
- 简单(这是首要的要求)
- 封装成帧
- 透明性
- 多种网络层协议
- 多种类型链路
- 差错检测
- 检测连接状态
- 最大传送单元
- 网络层地址协商
- 数据压缩协商
PPP协议不需要满足的要求:
- 纠错 (循环冗余也无法实现纠错)
- 流量控制
- 序号
- 多点线路
- 半双工或单工链路
PPP协议的组成
1992 年制订了 PPP 协议。经过 1993 年和 1994 年的修订,现在的 PPP 协议已成为因特网的正式标准[RFC 1661]
PPP 协议有三个组成部分
如图所示:
数据链路层协议可以用于异步串行或同步串行介质,使用LCP(链路控制协议)建立并维护数据链路连接
网络控制协议(NCP)允许在点到点连接上使用多种网络层协议
PPP协议帧格式
PPP 有一个 2 个字节的协议字段:
0x0021 — 信息字段就是IP 数据报。
0xC021 — 信息字段是 PPP 链路控制数据
0x8021 — 表示这是网络控制数据
0xC023 — 信息字段是安全性认证PAP
0xC025 — 信息字段是LQR
0xC223 — 信息字段是安全性认证CHAP
标志字段 F = 0x7E (符号“0x”表示后面的字符是用十六进制表示。十六进制的 7E 的二进制表示是 01111110)
地址字段 A 只置为 0xFF。地址字段实际上并不起作用
控制字段 C 通常置为 0x03
PPP 是面向字节的,所有的 PPP 帧的长度都是整数字节
问题:信息字段中出现了标志字段的值,可能会被误认为是“标志”,怎么办?
字节填充
将信息字段中出现的每个 0x7E 字节转变成为 2 字节序列(0x7D, 0x5E)
若信息字段中出现一个 0x7D 的字节, 则将其转变成为 2 字节序列(0x7D, 0x5D)
若信息字段中出现 ASCII 码的控制字符(即数值小于 0x20 的字符),则在该字符前面要加入一个 0x7D 字节,同时将该字符的编码加以改变
零比特填充方法
PPP 协议用在 SONET/SDH 链路时,是使用同步传输(一连串的比特连续传送)
这时 PPP 协议采用零比特填充方法来实现透明传输:
在发送端,只要发现有 5 个连续 1,则立即填入一个 0。接收端对帧中的比特流进行扫描。每当发现 5 个连续1时,就把这 5 个连续 1 后的一个 0 删除
PPP不使用序号和确认机制
原因如下:
- 在数据链路层出现差错的概率不大时,使用比较简单的 PPP 协议较为合理
- 在因特网环境下,PPP 的信息字段放入的数据是 IP 数据报,数据链路层的可靠传输并不能够保证网络层的传输也是可靠的
- 帧检验序列 FCS 字段可保证无差错接受
PPP协议的工作状态
当用户拨号接入 ISP 时,路由器的调制解调器对拨号做出确认,并建立一条物理连接
PC 机向路由器发送一系列的 LCP 分组(封装成多个 PPP 帧)
这些分组及其响应选择一些 PPP 参数,和进行网络层配置,NCP 给新接入的 PC机分配一个临时的 IP 地址,使 PC 机成为因特网上的一个主机
通信完毕时,NCP 释放网络层连接,收回原来分配出去的 IP 地址,接着,LCP 释放数据链路层连接。最后释放的是物理层的连接
广播信道的数据链路层
广播信道用于局域网-多台机器连成一个网
局域网
局域网最主要的特点是:网络为一个单位所拥有,且地理范围和站点数目均有限
局域网具有如下的一些主要优点:
- 具有广播功能:从一个站点可很方便地访问全网局域网上的主机,可共享连接在局域网上的各种硬件和软件资源
- 便于系统的扩展和逐渐地演变,各设备的位置可灵活调整和改变
- 提高了系统的可靠性、可用性和生存性
共享通信媒体
共享通信媒体分静态划分信道和动态媒体接入控制(多点接入)
静态划分信道使用的技术有:频分复用、时分复用、波分复用、码分复用(详细看我物理层的文章)
动态媒体接入控制(多点接入)又分为随机接入(主要被以太网采用!)与受控接入 ,如多点线路探询(polling),或轮询。(目前已不被采用)
以太网(局域网的一部分)
最初的以太网是将许多计算机都连接到一根总线上,当初认为这样的连接方法既简单又可靠,因为总线上没有有源器件
由于只有计算机 D 的地址与数据帧首部写入的地址一致,因此只有 D 才接收这个数据帧
这种模式采用CSMA/CD协议
载波监听多路访问/碰撞检测 -以太网使用的CSMA/CD协议
CSMA/CD 表示 Carrier Sense Multiple Access with Collision Detection
多路访问:表示许多计算机以多点接入的方式连接在一根总线上
载波监听:是指每一个站在发送数据之前先要检测一下总线上是否有其他计算机在发送数据,如果有,则暂时不要发送数据,以免发生碰撞
碰撞检测
计算机边发送数据边检测信道上的信号电压大小
- 当几个站同时在总线上发送数据时,总线上的信号电压摆动值将会增大(互相叠加)
- 当一个站检测到的信号电压摆动值超过一定的门限值时,就认为总线上至少有两个站同时在发送数据,表明产生了碰撞
- 所谓“碰撞”就是发生了冲突。因此**“碰撞检测”也称为“冲突检测”**
检测到碰撞后:
- 在发生碰撞时,总线上传输的信号产生了严重的失真,无法从中恢复出有用的信息来.
- 每一个正在发送数据的站,一旦发现总线上出现了碰撞,就要立即停止发送,免得继续浪费网络资源,然后等待一段随机时间后再次发送
电磁波在总线上的有限传播速率的影响
当某个站监听到总线是空闲时,也可能总线并非真正是空闲的
A 向 B 发出的信息,要经过一定的时间后才能传送到 B
B 若在 A 发送的信息到达 B 之前发送自己的帧(因为这时 B 的载波监听检测不到 A 所发送的信息),则必然要在某个时间和 A 发送的帧发生碰撞
碰撞的结果是两个帧都变得无用
CSMA/CD重要特性
- 使用 CSMA/CD 协议的以太网不能进行全双工通信而只能进行双向交替通信(半双工通信)
- 每个站在发送数据之后的一小段时间内,存在着遭遇碰撞的可能性,这种发送的不确定性使整个以太网的平均通信量远小于以太网的最高数据率
争用期
最先发送数据帧的站,在发送数据帧后至多经过时间两倍的端到端往返时延,就可知道发送的数据帧是否遭受了碰撞,这段时间称为争用期
经过争用期这段时间还没有检测到碰撞,才能肯定这次发送不会发生碰撞
对于 10 Mb/s 以太网,在争用期内可发送512 bit,即 64 字节
由于一检测到冲突就立即中止发送,这时已经发送出去的数据一定小于 64 字节
以太网规定了最短有效帧长为 64 字节,凡长度小于 64 字节的帧都是由于冲突而异常中止的无效帧
以太网及其扩展
以太网的两个标准
DIX Ethernet V2 :世界上第一个局域网产品(以太网)的规约
IEEE 的 802.3 标准
以太网与数据链路层的两个子层
为了使数据链路层能更好地适应多种局域网标准,802 委员会就将局域网的数据链路层拆成两个子层
- 逻辑链路控制 LLC (Logical Link Control)子层
- 媒体接入控制 MAC (Medium Access Control)子层
与接入到传输媒体有关的内容都放在 MAC子层,而 LLC 子层则与传输媒体无关,不管采用何种协议的局域网对 LLC 子层来说都是透明的,由于 TCP/IP 体系经常使用的局域网是 DIX Ethernet V2 而不是 802.3 标准中的几种局域网,因此现在 802 委员会制定的逻辑链路控制子层 LLC(即 802.2 标准)的作用已经不大了
很多厂商生产的适配器上就仅装有 MAC 协议而没有 LLC 协议
以太网提供的服务
以太网提供的服务是不可靠的交付,即尽最大努力的交付
当接收站收到有差错的数据帧时就丢弃此帧,其他什么也不做。差错的纠正由高层来决定
如果高层发现丢失了一些数据而进行重传,但以太网并不知道这是一个重传的帧,而是当作一个新的数据帧来发送
集线器(hub)
传统以太网最初是使用粗同轴电缆,后来演进到使用比较便宜的细同轴电缆,最后发展为使用更便宜和更灵活的双绞线
不用电缆而使用无屏蔽双绞线
每个站需要用两对双绞线,分别用于发送和接收
这种以太网采用星形拓扑,在星形的中心则增加了一种可靠性非常高的设备,叫做集线器(hub)
集线器是使用电子器件来模拟实际电缆线的工作,因此整个系统仍然像一个传统的以太网那样运行。集线器使用了大规模集成电路芯片,因此这样的硬件设备的可靠性已大大提高了
使用集线器的以太网在逻辑上仍是一个总线网,各工作站使用的还是 CSMA/CD 协议,并共享逻辑上的总线
集线器很像一个多接口的转发器,工作在物理层
以太网信道利用率
以太网的信道被占用的情况:
争用期长度为端到端传播时延的两倍,检测到碰撞后不发送干扰信号
帧长为 L (bit),数据发送速率为 C (b/s),因而帧的发送时间为
L/C = T0 (s)
一个帧从开始发送,经可能发生的碰撞后,将再重传数次,到发送成功且信道转为空闲(时为止,是发送一帧所需的平均时间
在以太网中定义了参数 a,它是以太网单程端到端时延与帧的发送时间 T0 之比
要提高以太网的信道利用率,就必须减小 时延 与 T0 之比
理想情况下的极限信道利用率 Smax为:
MAC
在局域网中,硬件地址又称为物理地址,或 MAC 地址
802 标准所说的“地址”严格地讲应当是每一个站的“名字”或标识符
- IEEE 的注册管理机构 RA 负责向厂家分配地址字段的前三个字节(即高位 24 位(总48位))
- 地址字段中的后三个字节(即低位 24 位)由厂家自行指派,称为扩展标识符,必须保证生产出的适配器没有重复地址
- 一个地址块可以生成224个不同的地址。这种 48 位地址称为 MAC-48,它的通用名称是EUI-48
- “MAC地址”实际上就是适配器地址或适配器标识符EUI-48
MAC的检查
适配器从网络上每收到一个 MAC 帧就首先用硬件检查 MAC 帧中的 MAC 地址
如果是发往本站的帧则收下,然后再进行其他的处理,否则就将此帧丢弃,不再进行其他的处理
发往本站的帧”包括以下三种帧:
- 单播(unicast)帧(一对一)
- 广播(broadcast)帧(一对全体)
- 多播(multicast)帧(一对多)
MAC帧格式
同步码告诉接收者要接收MAC帧了,用来迅速实现 MAC 帧的比特同步,为了达到比特同步,在传输媒体上实际传送的要比 MAC 帧还多 8 个字节
类型字段用来标志上一层使用的是什么协议,以便把收到的 MAC 帧的数据上交给上一层的这个协议
数据字段的正式名称是 MAC 客户数据字段
最小长度 64 字节 -18 字节的首部和尾部 = 数据字段的最小长度()48当数据字段的长度小于 46 字节时,应在数据字段的后面加入整数字节的填充字段,
以保证以太网的 MAC 帧长不小于 64 字节
无效MAC帧的判定
- 帧的长度不是整数个字节
- 用收到的帧检验序列 FCS 查出有差错(循环冗余校验不通过)
- 数据字段的长度不在 46 ~ 1500 字节之间
对于检查出的无效 MAC 帧就简单地丢弃。以太网不负责重传丢弃的帧
帧间最小间隔
帧间最小间隔为 9.6 s,相当于 96 bit 的发送时间
一个站在检测到总线开始空闲后,还要等待 9.6 微妙才能再次发送数据
这样做是为了使刚刚收到数据帧的站的接收缓存来得及清理,做好接收下一帧的准备
以太网的扩展与优化历程
使用集线器:
优点:
- 使原来属于不同碰撞域的局域网上的计算机能够进行跨碰撞域的通信
- 扩大了局域网覆盖的地理范围
缺点:
- 碰撞域增大了,但总的吞吐量并未提高
- 如果不同的碰撞域使用不同的数据率,那么就不能用集线器将它们互连起来
使用网桥:
网桥工作在数据链路层,它根据 MAC 帧的目的地址对收到的帧进行转发
网桥具有过滤帧的功能:当网桥收到一个帧时,并不是向所有的接口转发此帧,而是先检查此帧的目的 MAC 地址,然后再确定将该帧转发到哪一个接口
网桥能有效切割碰撞域:
优点:
- 过滤通信量
- 扩大了物理范围
- 提高了可靠性
- 可互连不同物理层、不同 MAC 子层和不同速率(如10 Mb/s 和 100 Mb/s 以太网)的局域网
缺点:
- 存储转发增加了时延
- 在MAC 子层并没有流量控制功能
- 具有不同 MAC 子层的网段桥接在一起时时延更大
- 网桥只适合于用户数不太多(不超过几百个)和通信量不太大的局域网,否则有时还会因传播过多的广播信息而产生网络拥塞,这就是所谓的广播风暴
透明网桥
目前使用得最多的网桥是透明网桥(transparent bridge)
“透明”是指局域网上的站点并不知道所发送的帧将经过哪几个网桥,因为网桥对各站来说是看不见的
透明网桥是一种即插即用设备,其标准是 IEEE 802.1D
交换机
网桥的升级版