本文档仅用于通信从业者学习交流
VoLTE
基础理论
+
关键技术
+LTE
技术原理
一、
LTE
语音相关
1.
基础概念
CS
语音
:
在
2G/3G
网络中,语音一般由
电路域交换
(
Circuit
Switch
,
CS
)系统提供,因此我们一
般也称之为
CS
语音。
IMS
语音
:
当
IP
多媒体子系统(
IP
Multi-media
Subsystem
,
IMS
)出现后,我们将
IMS
提供的语音
业务称之为
IMS
语音,一般也可以称之为
PS
(分组域交换,
Packet
Switch
)语音,这是因为
IMS
需要
通过分组域交换网络提供的
IP
通道与用户终端进行交互。一般认为,
IMS
语音是
LTE/EPS
阶段提供的
标准语音服务方案。
全
IP
网络
:
随着
IP
技术的发展,电信网络逐渐废弃了传统七号信令网络,而全面转向全
IP
网络,
以第三代伙伴项目(
3GPP
,
3rd
GenerationPartnership
Project
)组织为例,
LTE
将采用全
IP
化核心网,
抛弃了当前
2G/3G
系统中的电路交换域,而将分组交换域进行研究,从而定义了全
IP
的长期演进
/
演进
分组系统网络
LTE/EPS
(
Long
Term
Evolution/Evolved
PacketSystem[1]
)。因此在
LTE/EPS
网络中
CS
语音将不可用。
由于语音业务对时延的要求比较高,
在目前的
3G
及其以前的系统中,
都通过电路域承载。利用专
用资源。
语音业务通过
IP
承载已经成为发展趋势。在
LTE(
Long
Term
Evolution)
系统中
,
只存在分组域
,
语
音业务通过
VoIP(
Voice
over
Internet
Protocol)
承载。
2.LTE
语音实现方案
LTE
将采用全
IP
化核心网,从而带来对传统电路域语音业务承载的变革。
CS
回退
(
CS
FallBack
)技术。使用
CS
回退技术可把语音业务从
LTE
网络转移到传统的
2G
或
3G
网络,通过
传统的电路域
进行语音承载。缺点:
CS
回退过程中将发生
inter-
RAT
小区选择或切换,因
此带来较大的呼叫建立延迟,且
CS
回退要求
2G/3G
网络与
E-
UTRAN
网络重叠覆盖,没有传统
2G/3G
网络的新兴运营商无法采用此方案。
SR-
VCC
方案
。一般认为,
IMS
语音
是
LTE/EPS
阶段提供的标准语音服务方案,但是基于
IMS
的
VoIP
技术只支持在存在分组域的网络发起语音业务,无法保证用户从
E-UTRAN
移动到
GERAN
/
UTRAN/cdma2000
1X
网络后的语音连续性。为此
3GPP
提出了基于
IMS
的
SR-
VCC
方案,此方案支持
将分组域的语音业务
切换
到电路域,但需要运营商部署
IMS
系统。
VoLGA
方案。
考虑利用
LTE
接入网络,以数据包方式封装语音数据并透明传输到
CS
域的
MSC
服务器,从而实现在即使不存在
UTRAN/GERAN/cdma2000
1X
等传统接入网络的情况下,利用
E-
本文档仅用于通信从业者学习交流
UTRAN
接入网和传统的
CS
域核心网来提供
CS
语音业务
。此方案需在网络侧增加
VoLGA
接入网络控
制器
(VANC)
来实现语音业务管理。
3.VOIP
VOIP
建立在
IP
技术上的分组化、数字化传输技术,其
基本原理
是:通过语音压缩算法对话音进行
压缩编码处理,然后把这些语音数据按
IP
等相关协议进行打包,经过
IP
网络把数据包传输到目的地,
再把这些语音数据包串起来,经过解码解压处理后,恢复成原来的语音信号,从而达到由
IP
网络传送
话音的目的。
表
1
IP
电话服务与传统电话服务的比较
传统电话服务
VoIP
电路交换技术
分组交换技术
传输使用同步时分多址,故带宽利用
率较低
传输使用非同步时分多址,故带宽
利用率较高
当线路拥塞时可能无法接通,而一旦
接通就不会断开
当线路拥塞时,可能会出现分组丢
失等现象,会导致通信质量下降
使用
G.711
脉冲编码调制,
无压缩
语音
编码,传送速率为
64Kbps
通常使用语音
压缩编码
,编码速率
可以从
5.3Kbps
至
16Kbps
除卫星通信外,端到端的时延很小,
并且抖动很有限
端到端的时延相对较长,并且有显
著的抖动
能够保证良好的通信质量
通信质量受到
IP
网络的影响很大,语
音质量难以保证
通话线路是独立的,故而难以降低通
信成本
共享
IP
网络资源,大大降低通信成本
3.1VoIP
的基本传输过程
传统的电话网是以电路交换方式传输语音,所要求的传输
宽带
为
64kbit/s.
而所谓的
VoIP
是以
IP
分
组交换网络为传输平台,对模拟的语音信号进行压缩、打包等一系列的特殊处理,使之可以采用无连接
的
UDP
协议进行传输。
为了在一个
IP
网络上传输语音信号,要求几个元素和功能。最简单形式的网络由两个或多个具有
VoIP
功能的设备组成,这一设备通过一个
IP
网络连接。
VoIP
模型的基本结构图如图下图所示。从图中
可以发现
VoIP
设备是如何把语音信号转换为
IP
数据流,并把这些数据流转发到
IP
目的地,
IP
目的地
又把它们转换回到语音信号。两者之音的网络必须支持
IP
传输,且可以是
IP
路由器和网络链路的任意
组合。因此可以简单地将
VoIP
的传输过程分为下列几个阶段。
本文档仅用于通信从业者学习交流
1
、语音
-
数据转换
语音信号是模拟波形,通过
IP
方式来传输语音,不管是实时应用业务还是非实时应用业务,首先
要对语音信号进行模拟数据转换,也就是对模拟语音信号进行
8
位或
6
位的量化,然后送入到缓冲存储
区中,缓冲器的大小可以根据延迟和编码的要求选择。许多低比特率的编码器是采取以帧为单位进行编
码。典型
帧长为
10~30ms
.
考虑传输过程中的代价,
语音包
通常由
60
、
120
或
240m
s
的语音数据组成。
数字化
可以使用各种语音编码方案来实现,目前采用的语音
编码标准
主要有
ITU-T
G.711
.
源和目的地的
语音编码器必须实现相同的算法,这样目的地的语音设备帮可以还原模拟语音信号。
2
、原数据到
IP
转换
一旦语音信号进行
数字编码
,下一步就是对语音包以特定的帧长进行
压缩编码
。大部份的编码器都
有特定的帧长,若一个编码器使用
15ms
的帧,则把从第一来的
60ms
的包分成
4
帧,并按顺序进行编
码。每个帧合
120
个语音样点(抽样率为
8kHz
)。编码后,将
4
个压缩的帧
合成一个压缩的语音包
送
入网络处理器。网络处理器为语音
添加包头、时标和其它信息
后通过网络传送到另一端点。语音网络简
单地建立通信端点之间的物理连接(一条线路),并在端点之间传输编码的信号。
IP
网络不像电路交
换网络,
它不形成连接
,它要求把数据放在可变长的数据报或分组中,然后给每个数据报附带寻址和控
制信息,并通过网络发送,一站一站地转发到目的地。
3
、传送
在这个通道中,全部网络被看成一个从输入端接收语音包,然后在一定时间(
t
)内将其传送到网
络输出端。
t
可以在某全范围内变化,反映了网络传输中的抖动。网络中的同间节点检查每个
IP
数据附
带的寻址信息,并使用这个信息把该数据报转发到目的地路径上的下一站。网络链路可以是支持
IP
数
据流的任何拓结构或访问方法。
4
、
IP
包
-
数据的转换
目的地
VoIP
设备接收这个
IP
数据并开始处理。网络级提供一个
可变长度的缓冲器,用来调节网络
产生的抖动
。该
缓冲器可容纳许多语音包,用户可以选择缓冲器的大小。小的缓冲器产生延迟较小,
但不能调节大的抖动
。其次,解码器将经编码的语音包
解压缩后产生新的语音包
,这个模块也可以按
帧进行操作,完全和解码器的长度相同。若帧长度为
15ms
,,是
60ms
的语音包被分成
4
帧,然后它们
被
解码还原成
60ms
的语音数据流送入解码缓冲器。在数据报的处理过程中,
去掉寻址和控制信息
,保
留原始的原数据,然后把这个原数据提供给解码器。
5
、数字语音转换为模拟语音
播放驱动器将缓冲器中的语音样点(
480
个)取出送入声卡,通过扬声器
按预定的频率(例如
8kHz
)播出。
简而言之,语音信号在
IP
网络上的传送要经过从模拟信号到数字信号的转换、数字语音
封装成
IP
分组、
IP
分组通过网络的传送、
IP
分组的解包和数字语音还原到模拟信号等过程。
3.2
关键技术
语音编码标准
:
ITU-T
G.711
,数据速率为
64kbit/s
。
压缩编码标准
:有
ITU-T
G.723.1
和
ITU-T
G.729
,以及
AMR
等,其中
ITU-T
G.723.1
的数据速率
为
5.3kbit/s
或
6.3kbit/s
,而
ITU-T
G.729
的数据速率为
8
kbit/s
。
注
:
G.711
往往需要进一步压缩,因此它是其它语音编码算法的输入源。
语音传输技术
:先利用
RTP/TRCP
协议进行处理,再交给
UDP
进行传输。
本文档仅用于通信从业者学习交流
VoIP
利用
RTP
实时传输协议传送数据。
RTP
是一个基于
无连接
UDP
的应用协议,
UDP
是无连接
的,它不会对数据包的传送提供应答和跟踪,这样
RTP
也不会重新传送网络的丢包,这就要求网络传
输中应尽可能减少数据包的丢失;此外,按照
TCP
的应用协议,
RTP
也没有直接的碰撞控制,以致于
因为发送者发送太多太快的数据包,接收者将被淹没。为了克服这个问题,
RTP
应用程序总是以
固定速
率
发送数据包,这就要求网络能够尽量以固定的速率传输数据包
。
RTP
分组由
RTP
头部和净荷数据组成;RTP
分组由
UDP
包来进行传输,通常一个
UDP
包仅含一个
RTP
分组,若采用一定的封装方法,也可以包含多个
RTP
分组;其中的
RTP
净荷就是
RTP
传送的语音数
据。
控制信令技术
:有两种(
1
)
H.323
协议是一个协议族,包含
RAS
、
Q.931
、
H.245
等一系列的协
议,
RAS
协议用于呼叫接入控制等功能,
Q.931
协议用于实现呼叫控制,而
H.245
协议用于媒体信道控
制(
2
)
SIP
协议采用的是客户机
/
服务器(
C/S
)结构,定义了各种不同的服务器和用户代理,通过和服
务器之间的请求和响应来完成呼叫控制。
3.3VoIP
业务调度问题:
首先介绍一下
LTE
系统中的资源调度。
与传统
3G
技术不同的是,
LTE
系统采用下行
OFDMA
、
上行
SC-FDMA
的接入方式,供基站进行调度的传输资源由以前
3G
CDMA
系统的码域资源变成了
时频
二维资源
。同时,
LTE
系统中取消了专用信道,采用
共享信道
的调度式资源分配方式,
eNB
(基站)可
以根据不同用户的不同信道质量、业务的
QoS
要求以及系统整体资源的利用情况和干扰水平来进行
综
合调度
,从而更加有效地利用系统资源,提高系统的吞吐量,使得无线资源可以得到最大限度的有效利
用。但同时,这种调度方式带来的开销也是系统设计者必须考虑的问题之一。
在
LTE
系统中,取消了全部电路域的语音业务,而代之以数据域的
VoIP
业务。但由于语音用户的
数量往往比较庞大,
LTE
又采用共享式调度的资源分配方式,每次传输都需要相关的控制信息,所以过
大控制信息开销可能会成为
LTE
系统同时支持的用户数能达到的系统吞吐量的瓶颈。在
LTE
系统中,
其带宽所能支持的
VoIP
用户数是其可调度指示用户数的
5
倍左右,于是,对于
VoIP
业务而言,
LTE
本文档仅用于通信从业者学习交流
系统
控制信息的不足
将极大地限制其所同时支持的用户数。针对这类数据包大小比较固定,到达时间间
隔满足一定规律的实时性业务,
LTE
引入了一种新的调度方式———
半静态调度技术
。
LTE
系统中,每个用户会配置独有的无线网络标识(
RNTI
),
eNB
通过用
UE
的
RNTI
对
授权指
示
PD-CCH
进行掩码来区分用户,对于同一个
UE
的不同类型的授权信息,可能会通过不同的
RNTI
进
行授权指示。如对于动态业务,
eNB
会用
UE
的小区无线网络标识(
C-RNTI
)进行掩码,对于半静态
调度业务,使用半静态小区无线网络标识(
SPS-C-RNTI
)等。
在
LTE
的调度传输过程中,起初
eNB
通过
PDCCH
指示
UE
当前的调度信息,
UE
识别是半静态
调度,则保存当前的调度信息
,每隔固定的周期在相同的时频资源位置上进行该业务数据的发送或接
收。使用半静态调度传输,可充分利用语音数据包
周期性到达
的特点,
一次授权,周期使用
,可以有
效地节省
LTE
系统用于调度指示的
PDCCH
资源,从而在不影响通话质量和系统性能的同时,支持更
多的语音用户,并且为动态调度的业务保留一定的控制信息以供使用。
以典型的
VoIP
业务
为例,其数据包到达周期为
20
ms
,则
eNB
只要通过
PDCCH
给
UE
半静态调
度指示,
UE
即按照
PDCCH
的指示进行
本次
调度数据的传输或接收,并且在
每隔
20
ms
,在相同的时
频资源位置上进行新到达的
VoIP
数据包的传输或接收。如图
2
所示,标记为绿色的资源即为
UE
周期
进行发送或接收的资源位置。
对于半静态调度传输,主要有
3
个关键的步骤,即半静态调度传输的激活、半静态调度传输的
HARQ
过程和半静态调度传输资源的释放。
VoIP
业务具有的特点
,
例如
包比较小
,
为几十个字节
,
包的
到达间隔
和包的
大小基本上是固定
的。如
果针对
VoIP
业务的这些小包采用动态调度方法
,
信令负荷会很大。在
LTE
系统中要达到一定的
VoIP
用户容量
,
需要减少开销。因此
,
提出了
持续调度
(
PersistentScheduling)
的方法
,
即为
VoIP
业务周期性的
持续分配资源。如何利用
VoIP
业务的特点进行有效的调度,保证
QoS(
Quality
of
Service)
,最大程度的
减少信令开销,是需要研究的问题。
VoIP
业务存在三个状态
:
瞬态、激活期和静默期。
瞬态
包只发生在会话开始以及会话过程中
,
包的
头没有进行头压缩
,
因此这个状态的包比较大
,
包大小为
97byte
。
激活期
的包为进行了头压缩的语音业务
的数据
,
包大小为
35
~
49byte
。在
静默期
没有语音数据传输
,
只有由于背景噪声产生的
SID(
Silence
Descriptor)
包
,
包大小为
10
~
24byte
。以上包的大小值都是基于
AMR
(
Adaptive
Multi
Rate)
声码器
,
速率
为
12.2kbps
。包到达
间隔是固定的
,
在瞬态
/
激活期时为
20ms
,
静默期为
160ms
。从业务模型可以看出
,
VoIP
业务具有包比较小
,
包的大小比较固定
,
到达间隔比较固定的特点。
VoIP
业务的调度方案应当充分
利用这些特点
,
优化系统性能。
参考:
LTE
系统语音业务调度研究
(1)
;
LTE
系统的半静态调度传输解决方案。
3.4VoIP
中的
QoS
保障技术
主要包括抖动平滑技术、丢包处理技术、拥塞控制技术、回声消除技术以及静默压缩技术等,至于
降低延时的问题,需要考虑网络拥塞,并对链路层延时或抖动缓冲(
Jitter
Buffer
)延时进行改善。
3.5
有关
QoS
的
3GPP
标准