MPLS VPN

发表于： 2022-03-24 分类于：数通

字数： 6873 阅读：≈ 14分钟浏览：评论：

注意

此文提到的 MPLS VPN 具体指的是 BGP/MPLS IP VPN
此文提到的组网方案主要是Intranet

MPLS VPN 组网方案：

Intranet：一个VPN中的所用用户组成闭合用户群，同一VPN站点之间可以互访，不同VPN站点之间不能互访。

Extranet：一个VPN用户希望提供部分本VPN的站点资源给其他VPN用户

Hub&Spoke：在VPN中设置中心访问控制设备，其他用户的互访都通过中心访问控制设备。

MPLS VPN 介绍

MPLS VPN 使用 BGP 在骨干网上发布 VPN 路由，使用 MPLS 在骨干网上转发 VPN 路由，是一种常见的三层VPN技术。

组成部分：CE、PE、P，这些在广域网中有介绍。 CE作为MPLS VPN用户，不需要支持MPLS，也不需要感知到VPN的存在； PE作为运营商边缘设备，既需要支持MPLS，也需要对VPN路由进行处理，性能要求较高； P只需要具备基本MPLS转发能力，不维护VPN相关信息。

站点和VPN的关系

站点（Site）指的是相互之间具有IP连通性的一组IP系统，并且这组IP系统的IP连通性不需要通过运营商网络实现。

站点的划分根据设备的拓扑关系，而不是地理位置，如果公司A的X省网络和公司A的Y省网络之间的CE增加一条物理专线，那么它们就合为一个站点。

对于多个连接到同一服务提供商的站点，制定策略，划分为不同的集合，属于相同集合的站点之间才能通过服务商网络互访，这种集合就是 VPN 。

一个Site的设备可以属于多个VPN，换而言之，一个Site可以属于多个VPN。

MPLS VPN 技术实现包括：

MP-BGP（拓展的BGP，支持VPNv4地址族）：负责在PE和PE之间传递站点内的路由信息
LDP：负责PE与PE之间的隧道建立
VRF：负责PE的VPN用户管理
静态路由、IGP、BGP：负责PE与CE之间的路由信息交互

MPLS VPN 路由交互

MPLS VPN 路由交互包括：本地CE到入口PE、入口PE到出口PE、出口PE到远端CE

本地CE到入口PE

本地CE到入口PE之间使用静态路由、IGP或BGP交互路由信息，交互的都是标准的IPv4路由

入口PE到出口PE

PE收到路由

PE在收到CE传递来的路由之后，需要独立保存不同VPN的路由，并且需要解决地址重叠问题。

VRF（Virtual Routing and Forwarding，虚拟路由转发），又称VPN实例，用于实现VPN之间的路由表隔离

RD（Route Distinguisher，路由标识符），RD用来区分本地VRF，该属性仅本地有效。8个字节的RD+4个字节的IPv4地址组成96位VPNv4路由，使不唯一的IPv4地址转化为唯一的VPN-IPv4地址，该VPNv4路由在ISP域内传递（区分），RD给某VRF里面的路由打上标签，进而实现地址的复用而不产生冲突。

配置RD时，只需要指定RD的Administrator和Assigned Number子字段。

RT（Route Target），VPNv4路由携带的一个重要属性，它决定VPN路由的收发和过滤，PE依靠RT属性区分不同VPN之间路由。RT的格式长度和RD一样，都是8字节，都是三个字段（名称也一样）。

RT包括ERT和IRT：

Export Target：本地PE从直连站点学习到IPv4路由后，转换为VPN IPv4路由，并为这些路由添加Export Target。作为BGP的扩展团体属性随路由发布。
Import Target：PE收到其他PE发布的VPNv4路由时，检查其ERT属性。当此属性与PE上某个VRF的Import Target匹配时，PE将路由加入到该VRF的路由表中。

RT与RD区别？

RD与RD如此相似，为什么需要使用两个，直接使用一个属性来完成两项工作不好吗？

在网上查看了一些资料后，形成的个人理解： RD主要用于区分本地vpn路由，实现地址复用，说明的是来自哪里；而RT是为了指明这些vpnv4路由该去往何处，说明的是要去哪里。

拿学生毕设例子来说，一个学院下有多个专业，一个专业划分一VPN，一个专业的学生组成一个Site，专业的老师按照也组成一个Site，现在规定老师只能带本专业的学生毕设（对应Intranet组网方案），学生与毕设导师之间的选择，相当于同一VPN内不同站点之间的路由交互。

拿计算机学院为例，学生信息看作路由信息，其中学生姓名作为私有IP地址，不同专业（VPN）之间可能存在同名情况，无法区分，为了区分清楚，添加上专业名称作为标识符，对应的就是RD，但这仅仅描述了学生的信息，还需要包括老师的信息，需要将学生信息发送给老师所在的Site，进行交互，那么就还需要RT来告诉对端PE此条信息要去何处。

那么还是那个问题，我直接使用RD进行过滤不就好了吗，何必多一个RT呢？但问题是在某些复杂的情况下，一个VPN可能有多个RD（[VPN FRR]( VPN FRR技术 | 网英的日常 (netheroone.cn) )），此时会对于一个VPN实例，会有两个或以上的VPNv4路由。

因此，可以这么理解：RD只是用来确保路由前缀的唯一性的，并不能说明该前缀属于哪个VRF，还要搭配RT才能确认属于哪个VRF。

PE之间路由传递

PE之间使用MP-BGP进行路由传递，理由如下：

BGP使用TCP作为其传输层协议，提高了协议的可靠性，可以跨路由器的两个PE设备直接交互路由
BGP拓展性强，为PE间传播VPN路由提供了便利
PE之间需要传输的路由条目比较大，BGP只发送更新的路由，提高传递路由的数量同时不占用过多的链路带宽。

PE之间传输路由时，会有几个问题：直连PE的P上没有VPN的路由，无法根据IP地址进行转发，并且IP头部中不携带VPN相关的信息，PE无法区分数据所属的VPN。

解决办法是利用MPLS的标签来解决：

PE和P设备之间运行LDP，交换公网标签，建立PE之间的LSP隧道（公网隧道）
入口PE在通过MP-BGP传递VPNv4路由时，携带私网标签，用于区分不同VPN的数据。分配私网标签的方法有：
1. 基于路由的MPLS标签分配：为VPN路由表的每一条路由分配一个标签（one label per route）。这种方式的缺点是：当路由数量比较多时，设备入标签映射表 ILM（Incoming Label Map）需要维护的表项也会增多，从而提高了对设备容量的要求。
2. 基于VPN实例的MPLS标签分配：为整个VPN实例分配一个标签，该VPN实例里的所有路由都共享一个标签。使用这种分配方法的好处是节约了标签。
出口PE在接收到VPNv4路由后，需要执行 私网路由交叉 和 隧道迭代 来选择路由
- 私网路由交叉：VPNv4路由与本地VPN实例的VPN-Target进行匹配的过程称为私网路由交叉。PE在收到VPNv4路由后，既不进行优选，也不检查隧道是否存在，直接将其与本地的 VPN实例进行交叉。
- 隧道迭代：为了将私网流量通过公网传递到另一端，需要有一条公网隧道承载这个私网流量。因此私网路由交叉完成后，需要根据目的IPv4前缀进行路由迭代，即该IPv4路由的下一跳有对应的LSP存在；只有隧道迭代成功，该路由才被放入对应的VPN实例路由表。

出口PE到远端CE

MP-BGP 将VPNv4传递到远端PE之后，远端PE需要将VPNv4路由导入正确的VPN实例。MPLS VPN使用 RT 控制VPN路由信息的发布与接收。 PE根据RT将路由导入正确的VRF后，将RD值剔除，将IPV4路由通告给远端CE设备，这样远端的站点就学习到了路由。

路由交互全过程

MPLS VPN 报文转发

各方案的组网实例

前文提到 MPLS VPN 有三种组网方案，Intranet、Extranet和Hub&Spoke。

Intranet

一个VPN中的所有用户形成闭合用户群，相互之间进行流量转发，VPN中的用户不能和其他VPN的用户通信，站点通常属于一个组织。PE为每个站点创建VPN实例，并配置全网唯一的RD；PE通过IRT和ERT来控制不同VPN的站点无法互访。

Intranet组网方案中，骨干网通过IGP实现IP连通，使用MPLS LSP 公网隧道传输VPN数据，使用MP-BGP传递VPNv4路由

PE和CE之间的路由交换可以使用IGP、静态路由，要注意在PE上将IGP或静态路由的路由引入BGP，从而将站点的私网路由转换成BGP的VPNv4，通告给远端的PE；还可以使用BGP，但此时就无需在PE上手动执行路由重分发操作，PE会自动将客户（站点）路由转换为VPNv4路由并通告给远端PE，远端PE也会将收到的VPNv4路由转为标准IPv4路由通告给远端CE。

AS号替换

若PE与CE之间运行 EBGP，则可能出现两个站点的AS号相同的情况。

若CE1通告EBGP向PE1发送一条私网路由，并经过PE2发送到CE2，则CE2会由于AS号重复丢弃路由，导致属于同一VPN的站点之间无法连通。

解决办法：在PE上执行 peer substitute-as 使能AS号替换功能，即PE使用本地AS号替换收到的私网路由中CE所在VPN站点的AS号，这样就不会因为重复而丢弃了。

例如假设PE1的本地AS号为123，则PE1在向CE1发送BGP路由时，若发现AS_Path中包含65001，则会用123替换65001。所以，如果有一条路由从CE2传给PE2，再由PE2传给PE1，当PE1再传递给CE1，此时BGP的AS_Path为{123,123}，后面的123是被替换的。

但这样在某些场景又会出现环路：

CE1和CE3处于同一个VPN站点1，CE2处于站点2，Site1和Site2的AS号都为65001，为了Site1和Site2之间的路由正常学习，使能了AS替换功能。当CE1传递站点内路由给PE1，PE1传递给CE3，此时CE3会接收路由，导致路由环路。

解决办法：配置SoO（Site of Origin），例如在本例子中，在PE1的BGP上配置 peer 192.168.100.1 soo 200:1 和 peer 192.168.200.1 soo 200:1 （192.168.100.1和192.168.200.1分别是CE1和CE3上和PE1建立BGP对等体的接口地址。）

配置了BGP邻居的SoO后，当接收到该邻居的BGP路由后，会在路径属性中携带该SoO属性并通告给其他BGP邻居。向该邻居通告BGP路由时，会检查路由中的SoO属性是否等于配置的SoO值，如果相同则不通告，避免引起环路

Extranet

VPN用户可将部分站点中的网络资源给其他VPN用户进行访问。

上图中，Site2作为能被VPN1和VPN2访问的共享站点，需要保证：

PE2能够接收PE1和PE3发布的VPNv4路由
PE2发布的VPNv4能够被PE1和PE3接收
PE2不把从PE1接收的VPNv4路由发布给PE3，也不把从PE3接受的VPNv4发布给PE1

Hub&Spoke

将多个站点中的一个站点设为Hub站点，其余站点为Spoke站点。站点间互访必须通过Hub站点，通过Hub站点集中管控站点间的数据传输。

Spoke-PE需要设置Export Target为 Spoke 、Import Target为 Hub

Hub-PE需要使用两个接口或子接口（创建两个VPN实例），一个用于接收Spoke-PE发来的路由（Import Target 为 Spoke），另个一向Spoke-PE发布路由（Export Target 为 Hub）

发布路由过程：

Spoke -CE1 发布路由给Spoke - PE1 。
Spoke-PE1 通过IBGP将该路由发布给Hub-PE。
Hub-PE通过VPN 实例( VPN_in ) 的Import Target属性将该路由引入VPN_in路由表，并发布给Hub-CE 。
Hub - CE学习到该路由，并将该路由发布给Hub-PE的 VPN 实例( VPN_ out ) 。
Hub - PE通过VPN_out发布该路由给Spoke-PE2（携带VPN_out 的Export Target属性）。
Spoke-PE2该路由发布给Spoke-CE2 。

具体部署方案

Hub&Spoke 不支持 Hub-CE 与 Hub-PE 使用 IGP ，Spoke-CE 与 Spoke-PE 使用 EBGP 的方式来部署。

支持：方式一： Hub - CE 与 Hub- PE , Spoke - PE 与 Spoke - CE使用EBGP。在该方式中，Hub-CE通告VPN_out对应的EBGP连接发送给Hub-PE的路由可能带有 Hub-PE 的AS号，因此需要在Hub-PE上配置 允许本地AS编号重复

方式二： Hub - CE 与 Hub- PE , Spoke - PE与Spoke - CE使用 IGP

方式三： Hub-CE 与 Hub-PE 使用 EBGP, Spoke - PE 与 Spoke -CE使用 IGP

为什么不能使用IGP+EBGP？

答：会产生环路。

MCE组网

当一个私网需要根据业务或者网络划分VPN 时，不同VPN 用户间的业务需要完全隔离。此时，为每个VPN单独配置一台CE将增加用户的设备开支和维护成本。

• 具有MCE ( Multi-VPN-Instance, CE多实例CE ) 功能的CE设备可以在MPLS VPN组网应用中承担多个VPN 实例的CE功能，减少用户网络设备的投入。

MCE 将 PE 的部分功能扩展到 CE 设备，通过将不同的接口与 VPN 绑定，并为每个VPN创建和维护独立的路由转发表

MCE与对应的PE之间可以通过物理接口、子接口或者逻辑接口进行互联，PE上需要将这些接口绑定到对应的VPN实例。

MPLS的LSP表项

需要明确的一点，标签分发方向和数据报文转发方向是相反的，即发送标签时是作为上游，而转发报文时是作为下游。需要注意的是，这里做了配置，P设备作为Egress，向倒数第二跳发送的还是隐式空标签，PE1和PE2则是发送非空标签。

以PE1来说，第一条表项，即PE1作为Egress角色向下游发送标签24246后，数据报文携带该标签进入PE1时，进行解封装，因此无out label 第二条表项，PE1作为倒数第二跳的Transit角色，对于FEC 2.2.2.9 ，向下游发送标签24252，数据报文携带该标签进入PE1，进行标签交换，由于P设备作为Egress时向倒数第二跳发送隐式空标签，即3，因此PE1标签交换后out label为3，因此弹出标签，直接查路由表转发第三条表项，in label标签为空，即报文进入PE1时并不使用MPLS转发，但PE1作为transit，使用MPLS标签转发第4、5条表项类似第2、3条。

跨域方案

option B 跨域方案中，ASBR会修改label

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
[ASBR]dis mpls forwarding ilm 
Total ILM entries: 10

Flags: T - Forwarded through a tunnel
       N - Forwarded through the outgoing interface to the nexthop IP address
       B - Backup forwarding information
       A - Active forwarding information
       M - P2MP forwarding information
InLabel Oper    VRF   Flag SwapLabel Forwarding Info 
--------------------------------------------------------------------------------
24119   SWAP    0     TA   24125     1
24120   SWAP    0     TA   24126     1
24121   SWAP    0     TA   24256     7
24122   SWAP    0     TA   24254     7
24124   SWAP    0     TA   24128     5
24125   SWAP    0     TA   24128     4
24126   SWAP    0     TA   24127     4
24128   SWAP    0     TA   24127     1
24255   SWAP    0     NA   3         GE0/2                    100.1.0.10
24256   SWAP    0     NA   3         GE0/1                    100.1.0.6


[ASBR] dis mpls lsp
FEC                         Proto       In/Out Label    Out Inter/NHLFE/LSINDEX 
1.1.1.1/32                  LDP         24256/3         GE0/1                   
1.1.1.1/32                  LDP         -/3             GE0/1                   
2.2.2.2/32                  LDP         24255/3         GE0/2                   
2.2.2.2/32                  LDP         -/3             GE0/2                   
3.3.3.3/32                  LDP         3/-             -                       
100.1.0.14                  BGP         -/-             GE0/0                   
100.1.0.18                  BGP         -/-             GE5/0                   
1.1.1.1/24125               BGP         24119/24125     -                       
1.1.1.1/24126               BGP         24120/24126     -                       
1.1.1.1/24127               BGP         24128/24127     -                       
2.2.2.2/24254               BGP         24122/24254     -                       
2.2.2.2/24256               BGP         24121/24256     -                       
100.1.0.14/24127            BGP         24126/24127     -                       
100.1.0.14/24128            BGP         24125/24128     -                       
100.1.0.18/24128            BGP         24124/24128     -                       
100.1.0.14                  Local       -/-             GE0/0                   
100.1.0.6                   Local       -/-             GE0/1                   
100.1.0.10                  Local       -/-             GE0/2                   
100.1.0.18                  Local       -/-             GE5/0                   

[ASBR]dis bgp routing-table vpnv4 10.130.1.2

 BGP local router ID: 3.3.3.3
 Local AS number: 65000


 Route distinguisher: 1:1
 Total number of routes: 2
 Paths:   2 available, 1 best

 BGP routing table information of 10.130.1.0/24:
 From            : 100.1.0.14 (4.4.4.4)
 Rely nexthop    : 100.1.0.14
 Original nexthop: 100.1.0.14
 OutLabel        : 24128
 Community       : <65001:1>
 Ext-Community   : <OSPF Domain Id: 0.0.0.0:0>, <OSPF Router Id: 10.129.0.2:0:0
                   >, <OSPF AreaNum: 0.0.0.0 RouteType: 1 Option: 0>, <RT: 1:1>
 AS-path         : 65001
 Origin          : incomplete
 Attribute value : MED 3, pref-val 0
 State           : valid, external, best 
 IP precedence   : N/A
 QoS local ID    : N/A
 Traffic index   : N/A
 VPN-Peer UserID : N/A
 DSCP            : N/A
 EXP             : N/A
 Tunnel policy   : NULL
 Rely tunnel IDs : 4 

 From            : 100.1.0.18 (4.4.4.4)
 Rely nexthop    : 100.1.0.18
 Original nexthop: 100.1.0.18
 OutLabel        : 24128
 Community       : <65001:1>
 Ext-Community   : <OSPF Domain Id: 0.0.0.0:0>, <OSPF Router Id: 10.129.0.2:0:0
                   >, <OSPF AreaNum: 0.0.0.0 RouteType: 1 Option: 0>, <RT: 1:1>
 AS-path         : 65001
 Origin          : incomplete
 Attribute value : MED 100, pref-val 0
 State           : valid, external 
 IP precedence   : N/A
 QoS local ID    : N/A
 Traffic index   : N/A
 VPN-Peer UserID : N/A
 DSCP            : N/A
 EXP             : N/A
 Tunnel policy   : NULL
 Rely tunnel IDs : 5 

PE3通过EBGP发送10.130.1.2路由给ASBR，携带分配的label24128，下一跳为与PE3的BGP下一跳100.1.0.14，ASBR为该下一跳的FEC分配了标签24125，ASBR在发送10.130.1.2这条路由给IBGP-PE1时，修改下一跳为自身，并且修改label为24125发送给PE1

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
[PE1]dis bgp routing-table vpnv4 10.130.1.2

 BGP local router ID: 1.1.1.1
 Local AS number: 65000


 Route distinguisher: 1:1(vpn)
 Total number of routes: 1
 Paths:   1 available, 1 best

 BGP routing table information of 10.130.1.0/24:
 From            : 3.3.3.3 (3.3.3.3)
 Rely nexthop    : 100.1.0.5
 Original nexthop: 3.3.3.3
 OutLabel        : 24125
 Community       : <65001:1>
 Ext-Community   : <OSPF Domain Id: 0.0.0.0:0>, <OSPF Router Id: 10.129.0.2:0:0
                   >, <OSPF AreaNum: 0.0.0.0 RouteType: 1 Option: 0>, <RT: 1:1>
 AS-path         : 65001
 Origin          : incomplete
 Attribute value : MED 3, localpref 100, pref-val 0
 State           : valid, internal, best 
 IP precedence   : N/A
 QoS local ID    : N/A
 Traffic index   : N/A
 VPN-Peer UserID : N/A
 DSCP            : N/A
 EXP             : N/A
 Tunnel policy   : NULL
 Rely tunnel IDs : 1 

vpnv4邻居和vpn实例下的ipv4邻居

首先看一下两个配置 1、建立vpnv4邻居

1
2
3
4
5
bgp 65001
peer 1.1.1.1 as 65001

address-family vpnv4
  peer 1.1.1.1 enable

2、建立vpn实例下的ipv4邻居

1
2
3
4
5
6
bgp 65001
peer 1.1.1.1 as 65001

ip vpn-instance test
  address-family ipv4
    peer 1.1.1.1 enable

只有vpnv4邻居才能传递vpnv4路由，但这里有个概念的问题，以下图为例

图中所有路由均使用BGP，其中PE-1和CE-1之间建立的是vpn1实例下的ipv4邻居，PE2和CE-3之间建立的也是vpn1实例下的ipv4邻居，PE-1和PE-2建立的是公网实例下的vpnv邻居。

PE-1学习到CE-1上的路由时，是通过vpn1实例下的ipv4邻居学习到的，学习到路由的路由是ipv4路由，PE-1会将该路由加入到bgp的vpn实例下的ipv4路由表中，同时还会加入到vpnv4路由表中，接着通过vpnv4邻居将这个vpnv4路由发送给PE-2。这里需要注意的是，在PE-1上使用display bgp routing table vpnv4和display bgp routing table vpn-instance vpn1都能查看到CE-1传过来的这条路由

PE-2收到该vpnv4路由后，加入BGP vpnv4路由表，再查看RT值，加入对应vpn-instance实例下的BGP ipv4路由表，接着发给CE-3，此时发送的是ipv4路由。

McLsk888

MPLS VPN

MPLS VPN 介绍

MPLS VPN 路由交互

本地CE到入口PE

入口PE到出口PE

PE收到路由

PE之间路由传递

出口PE到远端CE

MPLS VPN 报文转发

各方案的组网实例

Intranet

Extranet

Hub&Spoke

MCE组网

MPLS的LSP表项

跨域方案

vpnv4邻居和vpn实例下的ipv4邻居

参考文章