# 进行中的工作/征求反馈：数据包批处理

* 原文链接：[Packet Batching](https://freebsdfoundation.org/wp-content/uploads/2023/02/Jones_WIP.pdf)
* 作者：**TOM JONES** & **JOHN BALDWIN**

在过去的 30 年里，我们使用的计算机变得超乎想象地快。1995 年发布的 Alpha AXP 论文谈到了为机器设计的目标——延续过去 25 年的趋势，速度提升 1000 倍。

我们的确实现了这个目标，最初作为 FreeBSD 目标的 386 机器如今相当于我们今天在键盘中使用的微控制器。

哪怕有这些变化，计算机性能的核心依然保持不变——每单位工作执行更少的指令，事情就会更快。这一网络领域的基本真理促使了若干不同的方法来提升性能。我们致力于将工作从 CPU 移到网络卡上，例如校验和卸载。如果网卡负责执行校验和计算，那么我们宝贵的 CPU 时间就可以用于其他任务。

校验和卸载取得了很好的效果，我们开始将其他任务从 CPU 移到网络接口上。TCP 段卸载（TSO）是下一个显著提升网络发送性能的机制。与其为我们要发送的 TCP 段形成 IP 数据包，我们可以形成一个模板，并将其与大量数据一起发送到网卡。网络接口负责分段，将数据包放到网络中。TSO 为 TCP 发送者带来了巨大好处，使我们能够在不耗尽单个核心的情况下充分利用 10 千兆网络接口。

TSO 让我们能够更加高效地利用宝贵的资源。通过批量处理数据并在传输时创建最终的块，我们减少了每个数据包发送所需的总线（内存和 PCI）事务数量。这对 TCP 来说通常是直观的，尤其是在我们批量发送数据流，且数据分块明确时。为了在 TCP 接收方复制这些改进，我们有了大接收卸载（LRO）。LRO 使我们能够再次减少维持高速数据传输所需的事务数量。

对于 UDP，Linux 提供了类似于 TSO 的通用机制，分别通过通用段卸载（GSO）和通用接收卸载（GRO）来实现。这些支持使 UDP 发送者的性能提升了大约 20%，而 GRO 的效果较难衡量，但机制已经存在。

FreeBSD 对 TSO 和 LRO 提供了出色的支持，但缺少类似 GSO 和 GRO 的机制。在去年的维也纳 EuroBSDCon 上，我与 John Baldwin 讨论了他正在研究的一种类似于 GRO 的机制，他称之为数据包批处理（Packet Batching）。

**TJ：** 数据包批处理工作有什么背景？

**JB：** 接收端的数据包批处理这个想法已经存在了一段时间，至少它在愿望清单中，很多人多次提到过。我们已经有一些特定于 TCP 的数据包批处理形式，包括发送（TSO）和接收（LRO）。这种数据包批处理的目标是比 LRO 更具通用性，以便它可以应用于其他协议（主要是 UDP）。

**TJ：** 为什么需要这项工作？

**JB：** 像 TSO 和 LRO 这样的数据包批处理方法的目标是通过每批次执行一次检查，而不是每个数据包执行一次，来摊销每个数据包的成本（例如网络栈中的头部字段检查等）。随着网络速度的提高快于 CPU 速度，单个数据包的开销问题变得越来越严重。确实，这个问题的一般修复方法是水平扩展，通过使用 RSS 将数据包分配到绑定到不同 CPU 的独立队列中，来帮助减少每个数据包的开销。然而，你不能将单个流分配到多个核心上，批处理方案旨在提高单个队列的效率。

**TJ：** 这项工作能带来哪些新特性/增强功能？

**JB：** 目标是提高每秒数据包数（PPS）和/或减少网络接收工作负载的 CPU 使用率。我不认为它对启用 LRO 时的 TCP 有帮助，主要是帮助 UDP。

**TJ：** 人们如何测试这项工作？通常我们需要强调在更多样化的工作负载下进行测试，这适用于这里吗？

**JB：** 欢迎进行基准测试。我使用 iperf3 进行的初步简单基准测试结果不一，并没有明确足够的优势来证明这些更改是值得的。这些更改确实增加了复杂性，因此在某些工作负载中需要明显的优势，我认为在它成为提交候选之前，必须证明它的效果。到目前为止，我在我的基准测试中没有观察到任何回归，只是微弱或零的增益。

**TJ：** 你希望如何获得反馈？

**JB：** 目前通过电子邮件直接给我反馈是最好的方式。在未来的某个时候，我会在 net@/arch@ 上开始一个公开的 RFC 线程，到时那个地方将是发送反馈的最佳地方。希望测试或审查补丁的人可以在 <https://github.com/freebsd/freebsd-src/compare/main...bsdjhb:-freebsd:cxgbe_batching> 找到它们。

从 John 的回答来看，目前还不清楚应该在哪些地方看到这些好处。iperf3 测量不能模拟非常忙碌服务器的工作负载。为了让 Packet Batching 在 FreeBSD 中提供好处，可能需要测试和调整更多的工作负载。通过下载 John 的 github 分支并实验你的网络流量，你可以帮助确立 FreeBSD 中的新接收优化。

***

**TOM JONES** 希望基于 FreeBSD 的项目能获得应有的关注。他住在苏格兰东北部，并提供 FreeBSD 咨询服务。

**JOHN BALDWIN** 是一名系统软件开发者。他已经在 FreeBSD 操作系统中直接提交了 20 年的代码，涉及内核的多个部分（包括 x86 平台支持、SMP、各种设备驱动程序和虚拟内存子系统）以及用户空间程序。除了写代码，John 还曾在 FreeBSD 核心和发布工程团队工作。他还为 GDB 调试器和 LLVM 做出了贡献。John 住在加利福尼亚州康科德市，和妻子 Kimberly 以及三个孩子：Janelle、Evan 和 Bella 一起生活。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://book.bsdcn.org/qi-kan/20230102-gou-jian-freebsd-web-fu-wu-qi/batch.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
