RTSP场景下RTP协议详解及音视频打包全流程

news/2025/2/22 13:22:21

RTSP场景下RTP协议详解及音视频打包全流程


一、RTSP与RTP的关系
  • RTSP:负责媒体会话控制(DESCRIBESETUPPLAYPAUSE),通过SDP协商传输参数(端口、编码格式、封装模式)。
  • RTP:实际传输音视频数据,基于UDP/TCP,与RTCP配合实现同步和网络状态反馈。

二、RTP头字段详解(RFC 3550)

RTP头固定12字节,字段含义及填写规则如下:

字段名位宽取值说明
Version (V)2 bits固定为2(0x80),表示RTP版本。
Padding §1 bit载荷末尾是否有填充字节(如加密对齐)。RTSP场景通常为0
Extension (X)1 bit是否启用头部扩展(如RFC 5285定义)。默认0,启用时需在SDP中声明。
CSRC Count (CC)4 bits贡献源(CSRC)数量。单路流通常为0
Marker (M)1 bit关键帧结束标记:视频的最后一个分片包设为1;音频包通常为0。
Payload Type (PT)7 bits载荷类型,SDP中动态映射(如96=H.264, 97=H.265, 8=PCMA, 14=MPEG Audio)。
Sequence Number16 bits包序列号,每发送一个RTP包自增1(用于检测丢包和乱序)。
Timestamp32 bits时间戳,基于编码时钟频率:<br>- 视频:90000 Hz(每帧增量=90000/fps)<br>- 音频:按采样率(如AAC=44100 Hz)。
SSRC32 bits同步源标识符,随机生成,同一流中唯一。

示例:H.264视频包头(时间戳增量=3000,30fps):

80 60 00 01   // V=2, P=0, X=0, CC=0, M=0, PT=96 (H.264)
00 01          // Sequence Number = 1
00 00 0B B8    // Timestamp = 3000
DE AD BE EF    // SSRC=0xDEADBEEF

三、视频打包实现
1. H.264视频打包(RFC 6184)
  • NALU结构
  +---------------+---------------+
  |F|NRI| Type    | Payload Data  |
  +---------------+---------------+
  • 封装模式:由SDP参数packetization-mode定义。
    • Mode 0(单NALU) :直接封装小NALU(如SPS/PPS)。
    RTP头 | NALU头(1B) | 数据
  • Mode 1(FU-A分片) :大NALU分片传输,添加FU头和标记位。
    RTP头 | FU Indicator(1B) | FU Header(1B) | 分片数据
  • FU IndicatorF|NRI|Type=28(0x7C)。

  • FU HeaderS|E|R|Type(S/E标志分片起止,Type为原始NALU类型)。

    • Mode 2(STAP-A组合) :聚合多个小NALU。
    RTP头 | STAP头(1B) | NALU1长度(2B) | NALU1数据 | NALU2长度(2B) | NALU2数据
  • 关键帧分片示例
  // 第一个分片
  RTP头(M=0) | 0x7C | 0x85(S=1, Type=5) | 分片数据

  // 最后一个分片
  RTP头(M=1) | 0x7C | 0x45(E=1, Type=5) | 分片数据
2. H.265视频打包(RFC 7798)
  • NALU头扩展:2字节,包含层次标识(LayerID)和时域层级(TID)。
  +---------------+---------------+---------------+
  |F| Type(6b) | LayerID(6b) | TID(3b)     |
  +---------------+---------------+---------------+
  • 分片模式(FU-A)
  RTP头 | FU Indicator(2B) | FU Header(1B) | 分片数据
  • FU Indicator:Type=49(0x62)。

  • FU Header:同H.264的S/E标志,Type为原始NALU类型(如32=IDR)。

  • 示例

  // 第一个分片
  RTP头 | 0x62 0x80(LayerID=0, TID=1) | 0x80(S=1, Type=32) | 分片数据
3. SDP配置示例
m=video 0 RTP/AVP 96
a=rtpmap:96 H264/90000
a=fmtp:96 packetization-mode=1; sprop-parameter-sets=Z0LAH9kAUAW6EAAAAwAQAAADA8PFRQ=,aM48gA==

四、音频打包实现
1. G.711(PCMU/PCMA)
  • 静态PT:0(PCMU)、8(PCMA)。
  • 封装:直接填充裸数据,时间戳按样本数递增。
  RTP头(PT=0/8) | 音频样本(每样本1字节)
2. AAC(RFC 3640)
  • 动态PT:通过SDP协商(如96)。
  • 封装:添加AU头声明数据长度。
  RTP头 | AU头长度(2b) | AU头(16b长度) | AAC数据
3. Opus(RFC 7587)
  • 封装:直接填充Opus帧,支持分片。
  RTP头 | TOC字段(配置参数) | Opus数据

五、音视频同步机制
  1. 时间戳对齐
    • 音频时间戳增量 = 采样数(如AAC每帧1024样本 → 增量=1024)。
    • 视频时间戳增量 = 90000 / 帧率(如30fps → 增量=3000)。
  2. RTCP同步
    • 发送端通过SR包传递NTP时间与RTP时间戳的映射。
    • 接收端计算播放时序偏差,动态调整缓冲区。

http://www.niftyadmin.cn/n/5862320.html

相关文章

ARM Linux V4L2 Camera 实验

使用 ov2640 V4L2 是 Video for linux two 的简称&#xff0c;是 Linux 内核中视频类设备的一套驱动框架&#xff0c;为视频类设备驱动 开发和应用层提供了一套统一的接口规范 使用 V4L2 设备驱动框架注册的设备会在 Linux 系统/dev/目录下生成对应的设备节点文件&#xff0c…

vxe-table实现动态列

vxe-table实现动态列 1.动态列解释2.解决步骤2.1将后端返回的动态列表头&#xff0c;按照格式拼接在固定列表头上2.2将后端返回的列表数据按照键值对格式组装 1.动态列解释 正常列表是有固定的列&#xff1b;我的需求是&#xff0c;最初只知道表格的固定两列&#xff0c;查询数…

Arcmap和ArcgisPro重装及配置迁移

近期要重装一下ArcgisPro&#xff0c;在此记录并作为大家的借鉴 1.备份配置文件&#xff1a;其中Desktop10.8为Arcmap的配置文件 2.通过控制面板卸载&#xff0c;arcpro卸载时间较长&#xff0c;先将语言包等卸载&#xff0c;最后再卸载5G主程序&#xff0c;有些文章会介绍清理…

【Linux专栏】rsync 同步文件时自动创建目录

Linux && Oracle相关文档,希望互相学习,共同进步 风123456789~-CSDN博客 1.背景 rsync 同步文件夹,之前的文章中也写过了(详见:【Linux专栏】find命令+同步 实验-CSDN博客 ),可以同步指定文件夹、或者筛选指定时间范围的文件夹,然后将符合条件的文件夹全部同步…

【Python爬虫(31)】解锁Python多线程编程:从入门到实战

【Python爬虫】专栏简介&#xff1a;本专栏是 Python 爬虫领域的集大成之作&#xff0c;共 100 章节。从 Python 基础语法、爬虫入门知识讲起&#xff0c;深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑&#xff0c;覆盖网页、图片、音频等各类数据爬取&#xff…

路由基本配置

学习目标 • 根据拓扑图进行网络布线。 • 清除启动配置并将路由器重新加载为默认状态。 • 在路由器上执行基本配置任务。 • 配置并激活以太网接口。 • 测试并检验配置。 • 思考网络实施方案并整理成文档。 任务 1&#xff1a;网络布线 使用适当的电缆类型连接网络设备。…

发现问题 python3.6.13+django3.2.5 只能以asgi启动server 如何解决当前问题

在 Python 3.6.13 和 Django 3.2.5 的组合下&#xff0c;如果你发现只能使用 ASGI 启动 Django 服务&#xff0c;而不能使用 WSGI&#xff0c;可能的原因有几个。我们来分析一下常见的问题和解决方案。 1. 默认 ASGI 支持 从 Django 3.0 开始&#xff0c;Django 引入了对 ASG…

矩阵-旋转图像

旋转图像 给定一个 n n 的二维矩阵 matrix 表示一个图像。请你将图像顺时针旋转 90 度。你必须在 原地 旋转图像&#xff0c;这意味着你需要直接修改输入的二维矩阵。请不要 使用另一个矩阵来旋转图像。输入&#xff1a;二维数组 输出&#xff1a;void 思路&#xff1a;tempM…