WebRTC的拥塞控制技术(Congestion Control)
liuian 2025-06-09 23:34 4 浏览
\1. 概述 对于共享网络资源的各类应用来说,拥塞控制技术的使用有利于提高带宽利用率,同时也使得终端用户在使用网络时能够获得更好的体验。在协议层面上拥塞控制是TCP的一个重要的组成部分;但是对于非面向链接的传输层协议,如UDP,其在协议层面上并没有对拥塞控制进行强制性的要求,这样做保证了最优的传输性能,且在拥塞控制的设计上也保留了更大的灵活性。 WebRTC为我们提供了强大的音视频媒体引擎,前端开发者可以通过调用几个简单的js接口就能实现基于Web浏览器的实时音视频通信。而在媒体数据传输上,WebRTC采用了实时性较强UDP协议,并使用了RTP/RTCP技术。本文的主要内容就是介绍WebRTC中基于RTP/RTCP实现的拥塞控制技术。
\2. 拥塞控制算法 WebRTC采用了两种拥塞控制算法:(1)基于延迟(delay-based)的拥塞控制算法;(2)基于丢包(loss-based)的拥塞控制算法。算法(1)由数据的接收方实现,接收方需要记录每个数据包到达的时间和大小,并计算每个数据分组之间(inter-group)的延迟的变化,由此判断当前网络的拥塞情况,并最终输出码率估计值由RTCP feedback(TMMBR或 REMB)反馈给发送方;算法(2)则由数据的发送方来实现,发送方通过从接收方周期性发来的RTCP RR(Receiver Report)中获取丢包信息以及计算RTT,并结合TMMBR或REMB中携带的码率信息算得最终的码率值,然后由媒体引擎根据码率来配置编码器,从而实现码率的自适应调整。从上面的描述可以看出,这两个算法在系统中并不是孤立存在的。
2.1 基于延迟(delay-based)的拥塞控制算法
基于延迟的拥塞控制算法可以分成以下4个部分:(1)到达时间模型(arrive-time model);(2)预过滤(Pre-filtering);(3)到达时间滤波器(arrive-time filter);(4)过载检测器(over-use detector)。
2.1.1 到达时间模型(arrive-time model)
设相邻两个数据分组到达接收方的时间间隔为t(i) - t(i-1),而两者被发送的时间间隔则为T(i) - T(i-1),那么就有延迟变量d(i)=t(i)-t(i-1) - (T(i)-T(i-1))。如果d(i) > 0,就说明数据在网络传输时存在延迟的现象。 在WebRTC中延迟变量d(i) = w(i)被视为随机过程W中一个采样点,并且是链路承载能力、网络当前传输状况以及当前发送速率等因素综合作用的结果。该随机过程W符合正态分布。当网络发生过载(over-use)时,我们期望w(i)会上升;当网络空闲(Under-use)时,则期望w(i)会下降。 测量方程进一步改写为 d(i) = m(i) + v(i),其中m(i)符合均值为0的正态分布(标准正态分布),v(i)表示为网络抖动等因素带来的对数据延迟的影响。
【免费分享】音视频学习资料包、大厂面试题、技术视频和学习路线图,资料包括(C/C++,Linux,FFmpeg webRTC rtmp hls rtsp ffplay srs 等等)有需要的可以后台私信扣1免费领取~
2.1.2 预过滤(Pre-filtering)
预过滤的目的是处理由于通道中断造成的延迟瞬间变大的情况。在通道发生中断时,数据包会持续进入网络队列中,而当通道恢复时,所有的数据包会在一个burst时间(5 ms)里面全部发送,而这些数据包可能原先包分布于多个数据分组。而预过滤所要做的就是将这些在同一个burst时间里发送的数据包合为一个数据分组。 这里涉及到了WebRTC中关于数据传输的一个设计--PacedSender。Encoded数据完成RTP封装之后先是被保存在本地应用的队列中,而不是直接发送到网络。此时可以将PacedSender视为一个数据发送的节拍器,它每隔一个burst时间启动一次,启动之后会将队列中的RTP包全数发出。 数据包会在下面两种情况下被划分到一个数据分组:
- 在同一个burst时间区间内被发送的数据包序列;
- 一个数据包与相邻数据包的到达时间间隔小于一个burst时间,同时d(i) < 0,那么这个数据包将会被划到当前的分组中。
2.1.3 到达时间滤波器(arrive-time filter)
在此系统希望通过预测m(i)来检测当前的网络是否过载;而这里所采用的预测方法是卡尔曼滤波(Kalman filter)。
状态方程:m(i+1) = m(i) + u(i), 其中u(i)表示为状态噪声,符合0均值正态分布。
测量方程:d(i) = m(i) + v(i), 其中v(i)表示为测量噪声,符合0均值正态分布。 卡尔曼滤波器根据“5组公式”来迭代更新m(i) 的估计值m_hat(i),该估计值m_hat(i)则是下文过载检测器的检测依据。关于卡尔曼滤波器如何实现预测的详细介绍在这里就不做展开了,可参考文献[3]。
2.1.4 过载检测器(over-use detector)
通过Kalman 滤波器能够获得延迟变量m(i)的估计值,而过载检测器的工作原理其实就是通过m(i)与阈值del_var_th进行比较来对当前的网络拥塞状况进行检测。如果m(i) > del_var_th且m(i) > m(i-1),同时该状态至少持续了overuse_time_th毫秒,则判断为网络过载(Over-use);如果m(i) < -del_var_th,则判断为网络空闲(Under-use);剩余的情况都被判断为Normal状态。
由此可见,阈值del_var_th的设计对于整个算法的性能来说至关重要。如果del_var_th的值设得过大,那么整个算法的动态就会显得过于平滑,此时只有在数据分组严重delay时检测器才会触发over-use的信号;相反的,如果del_var_th的值设得过小,那么检测器就会对delay非常敏感,从而导致频繁触发over-use信号。因此,WebRTC提出了针对阈值del_var_th的动态调整算法: del_vat_th(i) = del_var_th(i-1)+ (t(i) - t(i-1)) * K(i) * (|m(i)| - del_var_th(i-1)) 其中,当|m(i)| < del_var_th(i-1)时K(i)=K_d;否则,K(i)=K_u。 在WebRTC中本小节所涉及的各参数的参考值如下: del_var_th(0) = 12.5 ms, overuse_time_th = 10 ms, K_u=0.01, K_d=0.00018
2.1.5 速率控制(rate control)
速率控制子系统根据当前网络的拥塞情况(由过载检测器提供),计算带宽估计值并请求发送方对速率进行调整。该子系统通过有限状态机对速率进行自适应调整。其状态迁移如下图所示:
- 状态 Increase: 表明当前没有检测到网络拥塞,在此状态下传输速率需要逐步增加;它先是通过乘性增加来调整速率(乘性因子为1.08),当速率接近临界值时再通过加性增加逐步收敛,而这里所谓的临界值是指上一次在状态Decrease 时统计的下行码率;
- 状态 Decrease: 表明当前检测到了网络拥塞,在此状态下传输速率需要逐步下降;在这里,WebRTC所采用的方法是乘性下降,其乘性因子为0.85;
- 状态 Hold: 表明保持当前的速率不做改变。
速率控制子系统最终会输出一个带宽估计值A_hat,并通过RTCP Feedback(TMMBR/REMB)请求发送方进行速率调整。 2.2 基于丢包(Loss-based)的拥塞控制算法 基于丢包的拥塞控制是通过对丢包率,RTT和带宽估计值A_hat这三个参数进行决策而实现的。其中带宽估计值A_hat正是由上节中的速率控制子系统所提供。 基于丢包的拥塞控制在每次收到对方发送RTCP之后都会运行:
- 当丢包率保持在[2%, 10%]时,当前数据发送方的带宽估计值As_hat保持不变;
- 当丢包率大于10%时,带宽估计值将会降低:As_hat(i) = As(i-1)*(1-p),其中p为丢包率;
- 当丢包率小于2%时,带宽估计值将会上升:As_hat(i) = As(i-1)*1.05。
As_hat更新之后将与A_hat进行比较,然后取两者中的较小值作为最终的带带宽估计值。 其实在原生的代码中,系统还会将丢包率和RTT作为参数,通过TFRC [RFC 5348]的吞吐率计算公式对当前的带宽进行估计,而最终的估计值则是取三者中的最小值。
\3. 后语 通过上文的介绍,我们知道WebRTC中的拥塞控制算法还是非常完备的。其分别针对数据包的延迟和丢包设计了delay-based和loss-based拥塞控制算法,在两者的共同作用之下,WebRTC能够满足大部分场景下的实时视频通话业务。但是,如果有要对WebRTC中的媒体引擎进行移植的朋友,首先要分析一下WebRTC的拥塞控制算法是否满足你的业务需求:如果是开发独立应用,由于业务闭环,直接使用现有的算法应该问题不大;但是,如果是用于开发提供类似VoLTE/VoWIFI这样的运营商增值服务的应用,需要依据运营商的技术手册和3GGP协议等来对拥塞控制算法进行适配。
Reference
[1] A Google Congestion Control Algorithm for Real-Time Communication draft-ietf-rmcat-gcc-02
[2] RFC 5348
[3] http://blog.csdn.net/xiahouzuoxin/article/details/39582483
[4] 3GPP TS 26.114
作者:qiuyi943
- 上一篇:当前端也拥有 Server 的能力(前端功能实现)
- 已经是最后一篇了
相关推荐
- WebRTC的拥塞控制技术(Congestion Control)
-
\1.概述对于共享网络资源的各类应用来说,拥塞控制技术的使用有利于提高带宽利用率,同时也使得终端用户在使用网络时能够获得更好的体验。在协议层面上拥塞控制是TCP的一个重要的组成部分;但是对于非面向...
- 当前端也拥有 Server 的能力(前端功能实现)
-
今天看了不少文章,比较感兴趣的是CacheAPI。它是浏览器Request/Response的缓存管理工具,其使用风格和运用场景让我瞬间联想到了ServiceWorker和FetchA...
- Node 如何在 Controller 层进行数据校验
-
作者:山月行转发链接:https://mp.weixin.qq.com/s/UAU_Vpu3o53zqEAKDYgvQQ前言幽默风趣的后端程序员一般自嘲为CURDBoy。CURD,也就是对某一存...
- JWT深度解析:现代Web身份验证的通行证-优雅草卓伊凡
-
JWT深度解析:现代Web身份验证的通行证为什么现在都是JWT为什么要restful-优雅草卓伊凡一、JWT的本质与构成1.1JWT的定义解析JWT(JSONWebToken)是一种开放标准(R...
- Expo SDK 53.0.7 的 超详细 app.json 和 eas.json 配置项说明
-
以下是针对ExpoSDK53.0.7的超详细app.json和eas.json配置项说明,包含所有可能的配置项和实际用例:app.json完整配置手册(ExpoSDK53){...
- 搞懂JSON Schema:给数据加个“身份证”,不再“乱七八糟”!
-
JSON以其简洁、易读的特性广受欢迎,但当数据变得庞大、复杂,或者需要与多人协作时,你是不是也遇到过这些烦恼:“前端传来的数据格式不对,导致后端报错了!”“我的API文档写了一大堆,但别人还是不清楚数...
- W3C 发布 WebAssembly 2.0 工作草案
-
4月20日,W3C公布了WebAssembly2.0的第一批公共工作草案。该草案由3部分组成,分别是:WebAssemblyCoreSpecification–Version...
- ECMAScript标准制定过程展示及ES7新特性披露
-
2015年6正式发布的ES6是ECMAScript的最新版本,它的发布具有里程碑意义,不仅带来了众多的新特性,而且自此将改变ECMAScript的发布策略。本文将会介绍ECMAScript标准的最新...
- 微信小程序云开发教室预约系统的前后端交互与数据库设计
-
需求描述:需要申请使用教室时,可点击教室申请查看教室的使用状况及相关设备。确定好需要的教室后,按学期、校区、教学楼、周次、星期、节次、等维度筛选,并备注用途。例如:当我点击该教室申请占用后,该教室状态...
- 微软推出ManifoldJS,Web App自动转成各平台本地App
-
微软推出开源工具ManifoldJS,可以自动将WebApp转换成各种平台的App(安卓、iOS、ChromeOS、Windows)。ManifoldJS通过获取网站meta-data信息,即可产...
- 听说你需要一个云笔记,正好我们做了一个
-
一星期前,我只是想看看大家是不是有同样的需求,于是我发了一篇《听说你需要一个云笔记,正好我们这里有一个》。结果到了第二天,这个当时只有README.md的项目,已经有好多的Star。后来,想了想这个A...
- RK3588-HDMIRX(瑞芯微rk3588芯片手册)
-
1.简介专栏总目录HDMIIN功能可以通过桥接芯片的方式实现,将HDMI信号转换成MIPI信号接收,RK3588芯片平台自带HDMIRX模块,可以直接接收HDMI信号。本篇文章主要介绍在RK3...
- 分享一个功能强大的Android日志库XLog
-
XLog是什么腾讯开源的Mars项目中有个XLog日志库。XLog是一个高性能文本存储方案,在真实环境中经受了微信数亿级别的考验,具有很好的稳定性。由于其是使用C语言来实现的,故有占用性能、内存小,存...
- Android系统基础(05) Android系统源码 调试
-
adbshell后面跟的命令主要来自:源码\system\core\toolbox目录和源码\frameworks\base\cmds目录。1adb命令@1常用命令adbget-prod...
- Python与Appium实现自动化测试(python3 appium移动端自动化)
-
目录1.什么是Appium2.启动一个app自动化程序的步骤3.appium服务介绍4.appium客户端使用5.adb的使用6.Appium启动过程分析1.什么是Appiumappium是一个开源...
- 一周热门
-
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
python使用fitz模块提取pdf中的图片
-
《人人译客》如何规划你的移动电商网站(2)
-
Jupyterhub安装教程 jupyter怎么安装包
-
- 最近发表
-
- WebRTC的拥塞控制技术(Congestion Control)
- 当前端也拥有 Server 的能力(前端功能实现)
- Node 如何在 Controller 层进行数据校验
- JWT深度解析:现代Web身份验证的通行证-优雅草卓伊凡
- Expo SDK 53.0.7 的 超详细 app.json 和 eas.json 配置项说明
- 搞懂JSON Schema:给数据加个“身份证”,不再“乱七八糟”!
- W3C 发布 WebAssembly 2.0 工作草案
- ECMAScript标准制定过程展示及ES7新特性披露
- 微信小程序云开发教室预约系统的前后端交互与数据库设计
- 微软推出ManifoldJS,Web App自动转成各平台本地App
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- table.render (33)
- uniapp textarea (33)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)