FreeBSD 中文社区 2025 第二季度问卷调查
FreeBSD 中文社区(CFC)
VitePress 镜像站QQ 群 787969044视频教程Ⅰ视频教程Ⅱ
  • FreeBSD 从入门到追忆
  • 中文期刊
  • 状态报告
  • 发行说明
  • 手册
  • 网络文章集锦
  • 笔记本支持报告
  • Port 开发者手册
  • 架构手册
  • 开发者手册
  • 中文 man 手册
  • 文章
  • 书籍
  • FreeBSD 中文期刊
  • 编辑日志
  • 2025-123 下游项目
    • FreeBSD 发布工程:新主管上任
    • GhostBSD:从易用到挣扎与重生
    • BSD Now 与将来
    • 字符设备驱动教程(第三部分)
    • 学会走路——连接 GPIO 系统
    • FreeBSD 中对 SYN 段的处理
    • FreeBSD 2024 年秋季峰会
  • 2024-1112 虚拟化
    • 字符设备驱动程序教程(第二部分)
    • 面向 Linux 和 Windows 用户的 bhyve
    • Xen 与 FreeBSD
    • Wifibox:一种嵌入式虚拟化无线路由器
    • 嵌入式 FreeBSD:Fabric——起步阶段
    • DGP:一种新的数据包控制方法
    • 会议报告:我在都柏林的 EuroBSDCon 体验
  • 2024-0910 内核开发
    • 字符设备驱动程序教程
    • VPP 移植到了 FreeBSD:基础用法
    • 利用 Kyua 的 Jail 功能提升 FreeBSD 测试套件的并行效率
    • FreeBSD 上的 Valgrind
    • 嵌入式 FreeBSD:探索 bhyve
    • TCP/IP 历险记:FreeBSD TCP 协议栈中的 Pacing
    • 实用软件:实现无纸化(Paperless)
  • 2024-0708 存储与文件系统
    • FreeBSD 中的 NVMe-oF
    • FreeBSD iSCSI 入门
    • 使用 ZFS 原生加密保护数据
    • 嵌入式 FreeBSD:打造自己的镜像
    • TCP LRO 简介
    • 基于 Samba 的时间机器备份
  • 2024-0506 配置管理对决
    • 基本系统中的 mfsBSD
    • rdist
    • Hashicorp Vault
    • 在 GitHub 上向 FreeBSD 提交 PR
    • 悼念 Mike Karels
    • 2024 年 5-6 月来信
    • 嵌入式 FreeBSD 面包板
    • TCP/IP 历险记:TCP BBLog
    • 实用软件:开发定制 Ansible 模块
  • 2024-0304 开发工作流与集成
    • FreeBSD 内核开发工作流程
    • FreeBSD 与 KDE 持续集成(CI)
    • 更现代的内核调试工具
    • 从零开始的 ZFS 镜像及 makefs -t zfs
    • 提升 Git 使用体验
  • 2024-0102 网络(十周年)
    • FreeBSD 中的 RACK 栈和替代 TCP 栈
    • FreeBSD 14 中有关 TCP 的更新
    • if_ovpn 还是 OpenVPN
    • SR-IOV 已成为 FreeBSD 的重要功能
    • FreeBSD 接口 API(IfAPI)
    • BATMAN:更优的可移动热点网络方式
    • 配置自己的 VPN——基于 FreeBSD、Wireguard、IPv6 和广告拦截
    • 实用软件:使用 Zabbix 监控主机
  • 2023-1112 FreeBSD 14.0
    • LinuxBoot:从 Linux 启动 FreeBSD
    • FreeBSD 容器镜像
    • 现在用 Webhook 触发我
    • 新的 Ports 提交者:oel Bodenmann (jbo@freebsd.org)
  • 2023-0910 Port 与软件包
    • 回忆录:与 Warner Losh(@imp)的访谈
    • 在你自己的仓库中定制 Poudriere 源
    • Wazuh 和 MITRE Caldera 在 FreeBSD Jail 中的使用
    • PEP 517
    • CCCamp 2023 旅行报告
  • 2023-0708 容器与云
    • 在 Firecracker 上的 FreeBSD
    • 使用 pot 和 nomad 管理 Jail
    • 会议报告:C 与 BSD 正如拉丁语与我们——一位神学家的旅程
    • 抒怀之旅:与 Doug Rabson 的访谈
    • 基于 Jail 的广告拦截教程
    • 我们收到的来信
  • 2023-0506 FreeBSD 三十周年纪念特刊
    • CheriBSD 近十多年的历程
    • AArch64:成为 FreeBSD 新的一级架构
    • 岁月如梭:我个人的时间线
    • 安装 FreeBSD 1.0:回顾 30 年前
    • ZFS 是如何进入 FreeBSD 的呢?
    • 我不是来自约克郡的,我保证!
    • 回忆录:采访 David Greenman Lawrence
    • FreeBSD 和早期的 Unix 社区
    • 早期的 FreeBSD 移植
    • FreeBSD 30 周年:成功的秘诀
    • FreeBSD 在日本:回忆之旅与今日之实
  • 2023-0304 嵌入式
    • CheriBSD port 和软件包
    • 让我们来试试 ChatGPT
    • GPU 直通
  • 2023-0102 构建 FreEBSD Web 服务器
    • ZFS 的原子 I/O 与 PostgreSQL
    • 虚拟实验室——BSD 编程研讨会
    • ZFS 简介
    • 会议报告:落基山庆祝女性计算机科学家
    • 进行中的工作/征求反馈:数据包批处理
    • 基金会与 FreeBSD 桌面
  • 2022-1112 可观测性和衡量标准
    • 在 FreeBSD 的 DDB 内核调试器中编写自定义命令
    • DTrace:老式跟踪系统的新扩展
    • 基于证书的 Icinga 监控
    • 活动监控脚本(activitymonitor.sh)
    • 实用 IPv6(第四部分)
    • EuroBSDCon 会议报道
    • 实用 Port:Prometheus 的安装与配置
    • 书评:《用火解决问题:管理老化的计算机系统(并为现代系统保驾护航)》Kill It with Fire: Manage Aging Computer Systems (and Future Proof Modern Ones)
  • 2022-0910 安全性
    • CARP 简介
    • 重构内核加密服务框架
    • PAM 小窍门
    • SSH 小窍门
    • 实用 IPv6(第三部分)
    • 书评:Understanding Software Dynamics(深入理解软件性能——一种动态视角)—— Richard L. Sites 著
    • 访谈:保障 FreeBSD 安全性
    • MCH 2022 会议报告
  • 2022-0708 科研、系统与 FreeBSD
    • 在 FreeBSD 上构建 Loom 框架
    • 教授本科生 Unix 课程
    • FreeBSD 入门研讨会
    • 实用 IPv6(第二部分)
    • 在 2022 年及以后推广 FreeBSD
    • 进行中的工作/征求反馈:Socket 缓冲区
    • FreeBSD 开发者峰会报告
    • 支持 Electromagnetic Field 2022
  • 2022-0506 灾难恢复
    • 使用 FreeBSD 构建高弹性的私有云
    • LLDB 14 —— FreeBSD 新调试器
    • 实用 IPv6(第一部分)
    • 利用 netdump(4) 进行事后内核调试
    • 进行中的工作/征求反馈:FreeBSD 启动性能
    • 实用 Port:在 OpenZFS 上设置 NFSv4 文件服务器
  • 2022-0304 ARM64 是一级架构
    • FreeBSD/ARM64 上的数据科学
    • Pinebook Pro 上的 FreeBSD
    • 嵌入式控制器的 ACPI 支持
    • 进行中的工作/征求反馈:Lumina 桌面征集开发人员
    • 实用 Port:如何设置 Apple 时间机器
  • 2022-0102 软件与系统管理
    • 为 FreeBSD Ports 做贡献
    • 使用 Git 贡献到 FreeBSD Ports
    • CBSD:第一部分——生产环境
    • 将 OpenBSD 的 pf syncookie 代码移植到 FreeBSD 的 pf
    • 进行中的工作/征求反馈:mkjail
    • 《编程智慧:编程鬼才的经验和思考》(The Kollected Kode Vicious)书评
    • 会议报告:EuroBSDCon 2021 我的第一次 EuroBSDCon:一位新组织者的视角
  • 2021-1112 存储
    • 开放通道 SSD
    • 构建 FreeBSD 社区
    • 与完美操作系统同行 27 年
    • 进行中的工作/征求反馈:OccamBSD
    • 通过 iSCSI 导入 ZFS ZIL——不要在工作中这样做——就像我做的那样
  • 2021-0910 FreeBSD 开发
    • FreeBSD 代码审查与 git-arc
    • 如何为 FreeBSD 实现简单的 USB 驱动程序
    • 内核开发技巧
    • 程序员编程杂谈
  • 2021-0708 桌面/无线网
    • 通往 FreeBSD 桌面的直线路径
    • FreeBSD 13 中的人机接口设备 (HID) 支持
    • Panfrost 驱动程序
    • 用 Git 更新 FreeBSD
    • FreeBSD 的新面孔
    • 想给你的桌面加点佐料?
  • 2021-0506 安全
    • 七种提升新安装 FreeBSD 安全性的方法
    • copyinout 框架
    • 使用 TLS 改善 NFS 安全性
    • Capsicum 案例研究:Got
    • 对 Jail 进行安全扫描
  • 2021-0304 FreeBSD 13.0
    • 展望未来
    • FreeBSD 13.0 工具链
    • FreeBSD 13.0 中有新加载器吗?
    • TCP Cubic 准备起飞
    • OpenZFS 中的 Zstandard 压缩
    • 会议报告:FreeBSD 供应商峰会
    • Git 不够吗?
  • 2021-0102 案例研究
    • Tarsnap 的 FreeBSD 集群
    • BALLY WULFF
    • Netflix Open Connect
    • FreeBSD 的新面孔
    • 写作学者的 FreeBSD
    • 在世界之巅
  • 2020-1112 工作流/持续集成(CI)
    • FreeBSD Git 快速入门
    • 使用 syzkaller 进行内核 Fuzzing
    • Mastering Vim Quickly 书评
    • 线上会议实用技巧
    • 在控制台上进行网络监控
  • 2020-0910 贡献与入门
    • 采访:Warner Losh,第 2 部分
    • 代码审查
    • 撰写良好的提交消息
    • 如何在不是程序员的情况下做出贡献——成为 FreeBSD 译者
    • 如何成为文档提交者
    • 谷歌编程之夏
    • 为 FreeBSD 期刊撰写文章
    • 你为什么使用 FreeBSD
    • FreeBSD 的新面孔
  • 2020-0708 基准测试/调优
    • FreeBSD Friday
    • 采访:Warner Losh,第 1 部分
    • 构建和运行开源社区
    • 在 FreeBSD 上轻松搭建我的世界(Minecraft)服务器
    • FreeBSD 的新面孔
  • 2020-0506 网络性能
    • 内核中的 TLS 卸载
    • 访谈:Michael W Lucas
    • FreeBSD 桌面发行版
    • 使用 Poudriere 进行 Port 批量管理
    • FreeBSD 的新面孔
由 GitBook 提供支持
LogoLogo

FreeBSD 中文社区(CFC) 2025

在本页
在GitHub上编辑
导出为 PDF
  1. 2023-0102 构建 FreEBSD Web 服务器

进行中的工作/征求反馈:数据包批处理

上一页会议报告:落基山庆祝女性计算机科学家下一页基金会与 FreeBSD 桌面

最后更新于1个月前

  • 原文链接:

  • 作者:TOM JONES & JOHN BALDWIN

在过去的 30 年里,我们使用的计算机变得超乎想象地快。1995 年发布的 Alpha AXP 论文谈到了为机器设计的目标——延续过去 25 年的趋势,速度提升 1000 倍。

我们的确实现了这个目标,最初作为 FreeBSD 目标的 386 机器如今相当于我们今天在键盘中使用的微控制器。

哪怕有这些变化,计算机性能的核心依然保持不变——每单位工作执行更少的指令,事情就会更快。这一网络领域的基本真理促使了若干不同的方法来提升性能。我们致力于将工作从 CPU 移到网络卡上,例如校验和卸载。如果网卡负责执行校验和计算,那么我们宝贵的 CPU 时间就可以用于其他任务。

校验和卸载取得了很好的效果,我们开始将其他任务从 CPU 移到网络接口上。TCP 段卸载(TSO)是下一个显著提升网络发送性能的机制。与其为我们要发送的 TCP 段形成 IP 数据包,我们可以形成一个模板,并将其与大量数据一起发送到网卡。网络接口负责分段,将数据包放到网络中。TSO 为 TCP 发送者带来了巨大好处,使我们能够在不耗尽单个核心的情况下充分利用 10 千兆网络接口。

TSO 让我们能够更加高效地利用宝贵的资源。通过批量处理数据并在传输时创建最终的块,我们减少了每个数据包发送所需的总线(内存和 PCI)事务数量。这对 TCP 来说通常是直观的,尤其是在我们批量发送数据流,且数据分块明确时。为了在 TCP 接收方复制这些改进,我们有了大接收卸载(LRO)。LRO 使我们能够再次减少维持高速数据传输所需的事务数量。

对于 UDP,Linux 提供了类似于 TSO 的通用机制,分别通过通用段卸载(GSO)和通用接收卸载(GRO)来实现。这些支持使 UDP 发送者的性能提升了大约 20%,而 GRO 的效果较难衡量,但机制已经存在。

FreeBSD 对 TSO 和 LRO 提供了出色的支持,但缺少类似 GSO 和 GRO 的机制。在去年的维也纳 EuroBSDCon 上,我与 John Baldwin 讨论了他正在研究的一种类似于 GRO 的机制,他称之为数据包批处理(Packet Batching)。

TJ: 数据包批处理工作有什么背景?

JB: 接收端的数据包批处理这个想法已经存在了一段时间,至少它在愿望清单中,很多人多次提到过。我们已经有一些特定于 TCP 的数据包批处理形式,包括发送(TSO)和接收(LRO)。这种数据包批处理的目标是比 LRO 更具通用性,以便它可以应用于其他协议(主要是 UDP)。

TJ: 为什么需要这项工作?

JB: 像 TSO 和 LRO 这样的数据包批处理方法的目标是通过每批次执行一次检查,而不是每个数据包执行一次,来摊销每个数据包的成本(例如网络栈中的头部字段检查等)。随着网络速度的提高快于 CPU 速度,单个数据包的开销问题变得越来越严重。确实,这个问题的一般修复方法是水平扩展,通过使用 RSS 将数据包分配到绑定到不同 CPU 的独立队列中,来帮助减少每个数据包的开销。然而,你不能将单个流分配到多个核心上,批处理方案旨在提高单个队列的效率。

TJ: 这项工作能带来哪些新特性/增强功能?

JB: 目标是提高每秒数据包数(PPS)和/或减少网络接收工作负载的 CPU 使用率。我不认为它对启用 LRO 时的 TCP 有帮助,主要是帮助 UDP。

TJ: 人们如何测试这项工作?通常我们需要强调在更多样化的工作负载下进行测试,这适用于这里吗?

JB: 欢迎进行基准测试。我使用 iperf3 进行的初步简单基准测试结果不一,并没有明确足够的优势来证明这些更改是值得的。这些更改确实增加了复杂性,因此在某些工作负载中需要明显的优势,我认为在它成为提交候选之前,必须证明它的效果。到目前为止,我在我的基准测试中没有观察到任何回归,只是微弱或零的增益。

TJ: 你希望如何获得反馈?

从 John 的回答来看,目前还不清楚应该在哪些地方看到这些好处。iperf3 测量不能模拟非常忙碌服务器的工作负载。为了让 Packet Batching 在 FreeBSD 中提供好处,可能需要测试和调整更多的工作负载。通过下载 John 的 github 分支并实验你的网络流量,你可以帮助确立 FreeBSD 中的新接收优化。


TOM JONES 希望基于 FreeBSD 的项目能获得应有的关注。他住在苏格兰东北部,并提供 FreeBSD 咨询服务。

JOHN BALDWIN 是一名系统软件开发者。他已经在 FreeBSD 操作系统中直接提交了 20 年的代码,涉及内核的多个部分(包括 x86 平台支持、SMP、各种设备驱动程序和虚拟内存子系统)以及用户空间程序。除了写代码,John 还曾在 FreeBSD 核心和发布工程团队工作。他还为 GDB 调试器和 LLVM 做出了贡献。John 住在加利福尼亚州康科德市,和妻子 Kimberly 以及三个孩子:Janelle、Evan 和 Bella 一起生活。

JB: 目前通过电子邮件直接给我反馈是最好的方式。在未来的某个时候,我会在 net@/arch@ 上开始一个公开的 RFC 线程,到时那个地方将是发送反馈的最佳地方。希望测试或审查补丁的人可以在 找到它们。

Packet Batching
https://github.com/freebsd/freebsd-src/compare/main...bsdjhb:-freebsd:cxgbe_batching