1 / 21

开发者手册

developers-handbook

适用于希望为 FreeBSD 开发软件的人（而不仅仅是开发 FreeBSD 本身的人）

FreeBSD 开发者手册

商标

FreeBSD 是 FreeBSD 基金会的注册商标。

IBM，AIX，OS/2，PowerPC，PS/2，S/390 和 ThinkPad 是在美国、其他国家或两者都是国际商业机器公司的商标。

IEEE，POSIX 和 802 是在美国注册的电气和电子工程师协会的商标。

Apple，AirPort，FireWire，iMac，iPhone，iPad，Mac，Macintosh，Mac OS，Quicktime 和 TrueType 是苹果公司在美国和其他国家注册的商标。

英特尔、赛扬、赛睿、酷睿、以太网、i386、i486、安腾、奔腾和至强是英特尔公司或其子公司在美国和其他国家/地区的商标或注册商标。

Linux 是 Linus Torvalds 的注册商标。

微软、IntelliMouse、MS-DOS、Outlook、Windows、Windows Media 和 Windows NT 分别是微软公司在美国和/或其他国家/地区的注册商标或商标。

Motif，OSF/1 和 UNIX 是 The Open Group 在美国和其他国家的注册商标，IT DialTone 和 The Open Group 是 The Open Group 的商标。

Sun，Sun Microsystems，Java，Java Virtual Machine，JDK，JRE，JSP，JVM，Netra，OpenJDK，Solaris，StarOffice，SunOS 和 VirtualBox 是 Sun Microsystems，Inc.在美国和其他国家的商标或注册商标。

制造商和销售商用来区分其产品的许多名称被声明为商标。在本文档中出现这些名称时，FreeBSD Project 已经意识到商标声明，这些名称后面跟着“™”或“®”符号。

概述

欢迎来到开发者手册。本手册还在不断完善中，是许多人共同努力的成果。许多部分尚不存在，一些已存在的部分也需要更新。如果您有兴趣参与这个项目，请发送电子邮件至 FreeBSD 文档项目邮件列表。

本文档的最新版本始终可从 FreeBSD 全球网络服务器获取。也可以从 FreeBSD 下载服务器或众多镜像站点之一以各种格式和压缩选项下载。

第一部分基础

第 1 章简介

1.1. 在 FreeBSD 上进行开发

我们现在准备开始了。系统已经安装好，你也准备开始编程了。但是从哪里开始呢？FreeBSD 提供了什么？作为程序员，它能为我做什么？

本章试图回答这些问题。当然，像其他任何技能一样，编程也有不同的熟练程度。对一些人来说，这是业余爱好；对另一些人来说，这是职业。本章的信息可能更偏向初学者；事实上，它对那些不熟悉 FreeBSD 平台的程序员可能非常有帮助。

1.2. BSD 的愿景

打造最佳的类 UNIX® 操作系统套件，既尊重最初的软件工具理念，也兼顾可用性、性能与稳定性。

1.3. 架构指导方针

我们的理念可通过以下指导方针来描述：

除非实现者无法完成一个真实的应用，否则不要添加新功能。
明确一个系统不是什么，与定义它是什么同样重要。不要试图满足全世界的所有需求；相反，应使系统具有可扩展性，以便以向后兼容的方式满足额外需求。
唯一比根据一个例子泛化更糟的，是在没有任何例子的情况下泛化。
如果一个问题尚未完全理解，最好根本不要提供解决方案。
如果用 10% 的工作量就能实现 90% 的效果，那就选更简单的方案。
尽可能将复杂性隔离开来。
提供机制，而不是政策。特别是，将用户界面策略交给客户端掌控。

摘自 Scheifler 与 Gettys：《X Window System》

1.4. /usr/src 的结构

第 2 章编程工具

2.1. 概要

本章是关于如何使用 FreeBSD 附带的一些编程工具的介绍，尽管其中大部分内容同样适用于许多其他版本的 UNIX®。本章不会尝试详细描述编码过程。大多数内容假设读者几乎没有或根本没有编程经验，尽管希望大多数程序员仍能从中找到一些有价值的内容。

2.2. 引言

然而，如果你从未在 UNIX® 平台上编写过程序，这些强大工具在最初可能会令人感到困惑。本文档的目标是帮助你快速上手，而不深入涉及高级主题。我们希望本文档能为你提供足够的基础知识，使你能够理解相关文档的内容。

大多数内容几乎不需要任何编程知识，尽管它假设你对 UNIX® 的基本操作已有一定掌握，并且愿意学习！

2.3. 编程简介

程序是一组指令，告诉计算机执行各种操作；有时它要执行的指令还取决于之前执行某条指令时发生了什么。本节将概述你可以给出这些指令（通常称为“命令”）的两种主要方式：一种是使用 解释器，另一种是使用 编译器。由于人类语言对于计算机来说太复杂，难以实现明确理解，因此这些命令通常以专门为此设计的语言编写。

2.3.1. 解释器

使用解释器时，语言本身是作为一个环境存在的，你可以在提示符下输入命令，解释器会立即执行这些命令。对于更复杂的程序，你可以把命令写进一个文件，然后让解释器加载并执行这个文件中的命令。如果出错，许多解释器会将你带入调试器，以帮助你查找问题。

这种方式的优点在于你可以立即看到命令的执行结果，错误也可以快速修正。最大的缺点是在你想与他人分享程序时，对方必须拥有相同的解释器，或者你必须以某种方式提供给他们这个解释器，并且他们还需要知道如何使用它。此外，用户在按错键后直接进入调试器的情况，可能也会让人不太舒服。从性能角度来看，解释器通常消耗较多内存，生成的代码效率也不如编译器高。

我认为，如果你从未编程过，解释型语言是最好的入门方式。这类环境典型地见于 Lisp、Smalltalk、Perl 和 Basic 等语言。也有人认为 UNIX® 的 shell（如 sh、csh）本身就是一种解释器，事实上很多人确实会编写 shell “脚本”来辅助完成他们机器上的各种“维护”任务。实际上，UNIX® 最初的理念之一就是提供许多可以在 shell 脚本中组合使用的小型实用程序，以完成有用的任务。

2.3.2. FreeBSD 提供的解释器

下面是一些可以通过 FreeBSD Ports 获取的解释器列表，并简要介绍了一些较为流行的解释型语言。

BASIC BASIC 是 “Beginner’s All-purpose Symbolic Instruction Code”（初学者通用符号指令代码）的缩写。它在 20 世纪 50 年代被开发出来，用于教授大学生编程；而在 20 世纪 80 年代，每台自重的个人计算机都配备了 BASIC，使它成为许多程序员的第一门编程语言。它也是 Visual Basic 的基础。

Lisp Lisp 是在 20 世纪 50 年代末期开发的一种语言，用于替代当时流行的“数值计算”语言。它不是基于数字，而是基于列表；事实上，其名称就是 “List Processing”（列表处理）的缩写。它在人工智能（AI）领域中非常流行。

Lisp 是一种极其强大而复杂的语言，但可能显得庞大且不易掌握。

Perl Perl 在系统管理员中非常流行，用于编写脚本；它也常用于 Web 服务器上编写 CGI 脚本。

Scheme Scheme 是 Lisp 的方言，它比 Common Lisp 更紧凑、更清晰。在大学中很受欢迎，因为它足够简单，可以作为初学者的第一门语言教学，同时抽象程度也高，适合用于科研工作。

Python Python 是一种面向对象的解释型语言。它的支持者认为这是一门非常适合初学者的语言，因为它容易上手，但并不像其他用于开发大型复杂应用的解释型语言那样受到限制（Perl 和 Tcl 是另外两种常用于此类开发的语言）。

Ruby Ruby 是一种解释型的纯面向对象编程语言。它因其易于理解的语法、编写灵活性强以及便于开发与维护大型复杂程序而广受欢迎。

Tcl 和 Tk Tcl 是一种可嵌入的解释型语言，因其良好的跨平台特性而得到广泛应用和普及。它既可用于快速编写小型原型应用，也可与 Tk（一个图形用户界面工具包）结合开发功能完备的正式程序。

2.3.3. 编译器

显然，这种方式不像使用解释器那样直接。然而，它允许你做很多用解释器很难甚至不可能完成的事情，比如编写与操作系统密切交互的代码——甚至编写你自己的操作系统！如果你需要编写高效的代码，它也非常有用，因为编译器可以花时间优化代码，而解释器则无法接受这种优化。此外，为编译器编写的程序通常比为解释器编写的程序更易于分发——你只需要给他们一个可执行文件副本，前提是他们使用的操作系统与你相同。

2.4. 使用 `cc` 编译

一旦你编写完你的杰作，下一步就是将它转换成能够（希望！）在 FreeBSD 上运行的形式。这通常涉及几个步骤，每个步骤都由一个独立的程序完成。

预处理你的源代码，移除注释并进行其他操作，如在 C 中展开宏。
检查你的代码的语法，查看你是否遵循了语言的规则。如果没有，它会报错！
将源代码转换为汇编语言——这非常接近机器代码，但仍然可以被人理解。据说。
将汇编语言转换为机器代码——是的，我们在谈论的是比特和字节，1 和 0。
检查你是否以一致的方式使用了诸如函数和全局变量之类的东西。例如，如果你调用了一个不存在的函数，它会报错。
如果你试图从多个源代码文件生成可执行文件，计算如何将它们组合在一起。
计算如何生成一个系统的运行时加载器能够加载到内存并运行的程序。
最后，将可执行文件写入文件系统。

“编译”一词通常仅指步骤 1 到 4，其余步骤被称为链接。有时步骤 1 被称为 预处理，步骤 3-4 被称为汇编。

幸运的是，几乎所有的细节都被隐藏了，因为 cc 是一个前端，它为你管理调用所有这些程序并传递正确的参数；只需输入

% cc foobar.c

就会将 foobar.c 按照上述步骤进行编译。如果你有多个文件需要编译，只需像这样操作：

% cc foo.c bar.c

cc 有很多选项，都可以在手册页中找到。以下是一些最重要的选项，并附有如何使用它们的示例。

% cc foobar.c               可执行文件是 a.out
% cc -o foobar foobar.c     可执行文件是 foobar

-c 仅编译文件，不进行链接。对于只想检查语法的简单程序，或使用 Makefile 的情况非常有用。

% cc -c foobar.c

这将生成一个名为 foobar.o 的 目标文件（而不是可执行文件）。可以将该目标文件与其他目标文件一起链接，生成可执行文件。

-g 生成可调试版本的可执行文件。这会使编译器将有关源文件和函数调用行的信息添加到可执行文件中。调试器可以利用这些信息，在你单步调试程序时显示源代码，这非常有用；缺点是这些额外的信息会使程序变得更大。通常，在开发程序时使用 -g 编译，而在确认程序正常工作后，则不使用 -g 编译“发布版本”。

% cc -g foobar.c

-O 生成优化版本的可执行文件。编译器执行各种巧妙的操作，尽力生成比普通版本运行更快的可执行文件。你可以在 -O 后添加一个数字，以指定更高等级的优化，但这往往会暴露编译器优化器中的 bug。

% cc -O -o foobar foobar.c

这将生成优化版的 foobar。

以下三个标志会强制 cc 检查你的代码是否符合相关的国际标准，通常称为 ANSI 标准，严格来说是 ISO 标准。

-Wall 启用 cc 作者认为值得启用的所有警告。尽管名称为 “Wall”，但它并不会启用 cc 能够生成的所有警告。

-ansi 关闭 cc 提供的大多数非 ANSI C 特性。尽管名称为 “ansi”，但它并不能严格保证你的代码符合标准。

-pedantic 关闭 cc 的所有非 ANSI C 特性。

没有这些标志，cc 将允许你使用一些其非标准的扩展功能。这些扩展虽然非常有用，但可能无法与其他编译器兼容——事实上，标准的主要目的之一就是允许人们编写能够在任何编译器和系统上运行的代码。这被称为 可移植代码。

通常，你应该尽量使代码具有可移植性，否则你可能需要在以后完全重写程序，以便它能够在其他地方工作——谁知道你几年后会使用什么呢？

% cc -Wall -ansi -pedantic -o foobar foobar.c

这将在检查 foobar.c 是否符合标准后生成一个名为 foobar 的可执行文件。

-l <library> 指定在链接时使用的函数库。

最常见的例子是在编译一个使用 C 中一些数学函数的程序时。与大多数其他平台不同，这些数学函数被放在一个与标准 C 库分开的库中，你需要告诉编译器将其添加进去。

规则是，如果库的名称是 libsomething.a，你需要给 cc 传递 -l<something> 参数。例如，数学库是 libm.a，因此你需要传递 -lm 给 cc。关于数学库的一个常见“陷阱”是，它必须是命令行中最后一个库。

% cc -o foobar foobar.c -lm

这将把数学库的函数链接到 foobar 中。

如果你正在编译 C++ 代码，使用 c++。在 FreeBSD 上，c++ 也可以通过 clang++ 调用。

% c++ -o foobar foobar.cc

这将从 C++ 源文件 foobar.cc 生成一个可执行文件 foobar。

2.4.1. 常见的 `cc` 查询和问题

2.4.1.1. 我编译了一个名为 foobar.c 的文件，但找不到名为 foobar 的可执行文件。它去了哪里？

记住，除非你特别告诉它，否则 cc 会将可执行文件命名为 a.out。使用 -o <filename> 选项：

% cc -o foobar foobar.c

2.4.1.2. 好的，我有一个名为 foobar 的可执行文件，在运行 `ls` 时能看到它，但当我在命令行中输入 foobar 时，告诉我没有这样的文件。为什么它找不到？

与 MS-DOS® 不同，UNIX® 在查找你要运行的可执行文件时，不会自动在当前目录中查找，除非你告诉它。输入 ./foobar，意思是“运行当前目录下名为 foobar 的文件”。

2.4.2. 我叫我的可执行文件为 test，但运行时什么也没发生。怎么回事？

大多数 UNIX® 系统都有一个名为 test 的程序，它位于 /usr/bin 目录，Shell 在检查当前目录之前会先找到它。你可以输入：

% ./test

或者给你的程序取个更好的名字！

2.4.2.1. 我编译了程序，刚开始似乎运行得很好，然后出现了一个错误，说什么“core dumped”。那是什么意思？

core dump 这个名字来源于 UNIX® 初期，当时计算机使用核心内存来存储数据。基本上，如果程序在某些条件下失败，系统会将核心内存的内容写入一个名为 core 的文件，程序员可以查看该文件以找出问题所在。

2.4.2.2. 很有意思，但我现在该做什么？

2.4.2.3. 当我的程序发生 core dump 时，它提到一个“segmentation fault”。那是什么意思？

这基本上意味着你的程序尝试对内存执行某种非法操作；UNIX® 设计的目的是保护操作系统和其他程序免受恶意程序的影响。

常见的原因包括：

尝试写入 NULL 指针，例如：
```
char *foo = NULL;
strcpy(foo, "bang!");
```
使用未初始化的指针，例如：
```
char *foo;
strcpy(foo, "bang!");
```
指针将具有一些随机值，运气好的话，它会指向一个程序无法访问的内存区域，内核会在程序产生任何损害之前终止它。如果运气不好，它可能会指向你程序内部的某个地方，破坏你的数据结构，导致程序神秘地失败。
尝试访问数组末尾之外的元素，例如：
```
int bar[20];
bar[27] = 6;
```
尝试存储到只读内存中，例如：
```
char *foo = "My string";
strcpy(foo, "bang!");
```
UNIX® 编译器通常会将类似 "My string" 的字符串字面量放入只读内存区域。

对 malloc() 和 free() 做不当操作，例如：

char bar[80];
free(bar);

或者

char *foo = malloc(27);
free(foo);
free(foo);

做出这些错误并不总是会导致程序出错，但它们总是糟糕的实践。某些系统和编译器对这些错误的容忍度不同，这就是为什么在一个系统上运行良好的程序，在另一个系统上可能会崩溃的原因。

2.4.2.4. 有时当我得到一个 core dump 时，它说是 bus error。我在 UNIX® 书上看到说这意味着硬件问题，但电脑似乎还在工作。这是真的吗？

不，幸运的是不是（当然，除非你真的遇到了硬件问题…）。这通常是指你以不应有的方式访问了内存。

2.4.2.5. 这个 core dump 的过程看起来很有用，如果我能在需要时使其发生就好了。我可以这样做吗，还是只能等到出错？

是的，你可以这样做，只需去另一个控制台或 xterm，执行

% ps

找出你的程序的进程 ID，然后执行

% kill -ABRT pid

其中 <pid> 是你查找的进程 ID。

如果你的程序陷入了死循环，这会很有用。如果程序捕获了 SIGABRT 信号，还有其他一些信号也有类似的效果。

2.5. Make

2.5.1. 什么是 `make`？

当你在处理一个简单的程序，只有一两个源文件时，输入

% cc file1.c file2.c

还算可以，但当有多个文件时，输入命令会变得非常繁琐——而且编译可能也会花费很长时间。

解决这个问题的一种方法是使用目标文件，并且只有在源代码发生变化时才重新编译源文件。所以我们可能会像这样：

% cc file1.o file2.o … file37.c …

如果我们只修改了 file37.c，而其他文件没有变化，则可以这样做。这样可以加快编译速度，但依然不能解决输入命令的问题。

或者我们可以写一个 shell 脚本来解决输入命令的问题，但它会重新编译所有文件，这在大型项目中非常低效。

如果我们有数百个源文件散布在不同地方呢？如果我们在一个团队中工作，而其他人没有告诉我们他们修改了我们使用的某个源文件怎么办？

也许我们可以将这两种方法结合起来，写一个 shell 脚本，其中包含某种规则，指示何时需要编译源文件。现在，我们需要一个可以理解这些规则的程序，因为这些规则对于 shell 来说有些复杂。

这个程序就是 make。它读取一个名为 makefile 的文件，文件中指定了不同文件之间的依赖关系，并根据这些规则计算哪些文件需要重新编译，哪些不需要。例如，某个规则可能会说：“如果 fromboz.o 比 fromboz.c 旧，说明 fromboz.c 可能被修改过，所以需要重新编译。”makefile 还会包含告诉 make 如何重新编译源文件的规则，这使它成为一个非常强大的工具。

makefile 通常保存在与其适用的源文件相同的目录中，并且可以命名为 makefile、Makefile 或 MAKEFILE。大多数程序员使用 Makefile 这个名字，因为它在目录列表的顶部，更容易被发现。

2.5.2. 使用 `make` 的示例

这是一个非常简单的 makefile：

foo: foo.c
	cc -o foo foo.c

它由两行组成，一行是依赖关系行，另一行是创建行。

依赖关系行由程序的名称（即目标）组成，后面跟着一个冒号，空格，再跟上源文件的名称。当 make 读取这一行时，它会查看 foo 是否存在；如果存在，它会比较 foo 的最后修改时间和 foo.c 的最后修改时间。如果 foo 不存在，或者比 foo.c 旧，它就会查看创建行，了解该做什么。换句话说，这就是判断 foo.c 是否需要重新编译的规则。

创建行以一个制表符开始（按下 tab 键），然后是你在命令行中输入的命令，来创建 foo。如果 foo 已过期，或者不存在，make 就会执行这个命令来创建它。换句话说，这就是告诉 make 如何重新编译 foo.c 的规则。

因此，当你输入 make 时，make 会确保 foo 与你对 foo.c 的最新更改保持同步。这个原理可以扩展到有数百个目标的 Makefile——实际上，在 FreeBSD 上，你只需在合适的目录中输入 make world 就可以编译整个操作系统！

makefile 的另一个有用特点是，目标不一定非得是程序。例如，我们可以有一个像这样的 makefile：

foo: foo.c
	cc -o foo foo.c

install:
	cp foo /home/me

我们可以通过输入以下命令告诉 make 我们想要创建哪个目标：

% make target

make 会只查看该目标并忽略其他目标。例如，如果我们输入 make foo，make 会忽略 install 目标。

如果我们只输入 make，make 将始终查看第一个目标，并在查看完该目标后停止，而不会查看其他目标。所以如果我们输入 make，它会先处理 foo 目标，必要时重新编译 foo，然后停止，而不会继续处理 install 目标。

请注意，install 目标实际上并不依赖任何东西！这意味着，当我们输入 make install 来制作该目标时，接下来的命令始终会执行。在这种情况下，它会将 foo 复制到用户的家目录。这通常在应用程序的 makefile 中使用，以便在程序正确编译后，将应用程序安装到正确的目录中。

这个话题有些难以解释。如果你不完全理解 make 是如何工作的，最好的方法是编写一个简单的程序，如 hello world，以及像上面那样的 makefile，并进行实验。然后，逐步尝试使用多个源文件，或者让源文件包含一个头文件。touch 命令在这里非常有用——它可以更改文件的日期，而不需要编辑它。

2.5.3. `make` 和包含文件

C 代码通常以一系列要包含的文件开始，例如 stdio.h。其中一些是系统包含文件，有些则是当前项目中的文件：

#include <stdio.h>
#include "foo.h"

int main(....

为了确保一旦 foo.h 被修改，这个文件会立刻重新编译，你需要在 Makefile 中添加它：

foo: foo.c foo.h

当你的项目变大，有越来越多的自定义包含文件时，跟踪所有包含文件及其依赖的文件将变得非常麻烦。如果你修改了一个包含文件，却忘记重新编译所有依赖于它的文件，结果可能会非常糟糕。clang 提供了一个选项来分析你的文件并生成包含文件及其依赖关系的列表：-MM。

如果你在 Makefile 中添加以下内容：

depend:
	cc -E -MM *.c > .depend

并运行 make depend，那么会生成一个 .depend 文件，内容包含对象文件、C 文件和包含文件的依赖关系：

foo.o: foo.c foo.h

如果你修改了 foo.h，下次运行 make 时，所有依赖于 foo.h 的文件都会重新编译。

每次添加包含文件时，别忘了运行 make depend。

2.5.4. FreeBSD Makefile

编写 Makefile 可能相当复杂。幸运的是，基于 BSD 的系统，如 FreeBSD，提供了一些非常强大的 Makefile，这些文件是系统的一部分。一个很好的例子就是 FreeBSD 的 ports 系统。以下是一个典型的 ports Makefile 的核心部分：

MASTER_SITES=   ftp://freefall.cdrom.com/pub/FreeBSD/LOCAL_PORTS/
DISTFILES=      scheme-microcode+dist-7.3-freebsd.tgz

.include <bsd.port.mk>

现在，如果我们进入该端口的目录并输入 make，会发生以下几件事：

系统检查此端口的源代码是否已经存在。
如果不存在，将建立与 MASTER_SITES 中指定的 URL 的 FTP 连接来下载源代码。
系统计算源代码的校验和，并与已知的源代码校验和进行比较，确保源代码在传输过程中没有损坏。
应用所需的任何更改，使源代码能够在 FreeBSD 上正常工作——这称为 patching。
进行源代码所需的特殊配置。（许多 UNIX® 程序在编译时会试图找出它们运行的 UNIX® 版本和所支持的 UNIX® 特性——在 FreeBSD 的 ports 系统中，这些信息会被提供给源代码。）
编译程序的源代码。实际上，我们进入源代码解压的目录并执行 make——程序自己的 makefile 已包含构建程序所需的信息。
我们现在得到了编译好的程序。如果需要，可以进行测试；当我们确认程序正常工作时，可以输入 make install，这会将程序和任何需要的支持文件复制到正确的位置，并在 package database 中创建条目，以便以后如果改变主意，可以轻松卸载该端口。

现在你应该会同意，这个四行的脚本非常强大！

其中的秘密就在于最后一行，它告诉 make 查找系统的 makefile 文件 bsd.port.mk。这一行很容易被忽视，但正是它包含了所有的巧妙内容——有人编写了一个 makefile，告诉 make 执行上述所有操作（包括一些我没有提到的内容，如处理可能发生的错误），任何人只需要在自己的 makefile 中加上这一行，就可以使用这些功能！

如果你想查看这些系统的 makefile，它们位于 /usr/share/mk，但最好等你熟悉了 makefile 的使用后再去查看，因为它们非常复杂（如果查看时，记得准备好一瓶浓咖啡！）

2.5.5. `make` 的高级用法

许多 ports 应用程序使用 GNU make，它提供了非常好的 "info" 页面。如果你已经安装了这些 ports，GNU make 会自动安装为 gmake。它也可以作为一个独立的端口或包安装。

要查看 GNU make 的 info 页面，你需要编辑 /usr/local/info 目录下的 dir 文件，添加一行：

* Make: (make).                 The GNU Make utility.

添加后，你可以输入 info 并从菜单中选择 make（或者在 Emacs 中，使用 C-h i）。

2.6. 调试

2.6.1. 可用调试器简介

使用调试器可以在更受控的环境下运行程序。通常，您可以逐行执行程序，检查变量的值，修改变量，指示调试器运行到某个特定位置后停止，等等。还可以附加到一个正在运行的程序，或加载核心文件以调查程序崩溃的原因。

注意

这两个调试器具有相似的功能集，因此选择使用哪个调试器很大程度上取决于个人喜好。如果只熟悉其中一个，可以使用该调试器。如果对两者都不熟悉，或者都熟悉但希望在 Emacs 中使用其中一个，应该选择 gdb，因为 lldb 不支持 Emacs。否则，尝试两者并看看哪个更适合自己。

2.6.2. 使用 lldb

2.6.2.1. 启动 lldb

通过输入以下命令启动 lldb：

% lldb -- progname

2.6.2.2. 使用 lldb 运行程序

使用 -g 编译程序，以便充分利用 lldb。即使不加 -g 也可以使用，但它将只显示当前正在运行的函数的名称，而不是源代码。如果它显示类似以下的行：

Breakpoint 1: where = temp`main, address = …

（没有源代码文件名和行号的指示）表示程序没有使用 -g 编译。

注意
大多数 lldb 命令都有可以替代的简短形式，这里使用了较长的形式以便更清晰。

在 lldb 提示符下，输入 breakpoint set -n main。这将告诉调试器不要显示程序运行中的初始设置代码，并在程序的代码开始时停止执行。然后输入 process launch 以实际启动程序——它将从初始设置代码开始，然后在调用 main() 时被调试器停止。

要逐行执行程序，输入 thread step-over。当程序进入函数调用时，输入 thread step-in 进入函数。一旦进入函数调用，输入 thread step-out 退出函数，或使用 up 和 down 快速查看调用者。

以下是如何使用 lldb 查找程序错误的一个简单示例。我们有一个故意出错的程序：

#include <stdio.h>

int bazz(int anint);

main() {
	int i;

	printf("This is my program\n");
	bazz(i);
	return 0;
}

int bazz(int anint) {
	printf("You gave me %d\n", anint);
	return anint;
}

此程序将 i 设置为 5 并将其传递给函数 bazz()，然后打印出我们给它的数字。

编译并运行该程序将显示：

% cc -g -o temp temp.c
% ./temp
This is my program
anint = -5360

这不是预期的结果！该是时候看看发生了什么了！

% lldb -- temp
(lldb) target create "temp"
Current executable set to 'temp' (x86_64).
(lldb) breakpoint set -n main				跳过设置代码
Breakpoint 1: where = temp`main + 15 at temp.c:8:2, address = 0x00000000002012ef	lldb 设置断点在 main()
(lldb) process launch					运行到 main()
Process 9992 launching
Process 9992 launched: '/home/pauamma/tmp/temp' (x86_64)	程序开始运行

Process 9992 stopped
* thread #1, name = 'temp', stop reason = breakpoint 1.1	lldb 停在 main()
    frame #0: 0x00000000002012ef temp`main at temp.c:8:2
   5	main() {
   6		int i;
   7
-> 8		printf("This is my program\n");			指示停在的行
   9		bazz(i);
   10		return 0;
   11	}
(lldb) thread step-over			执行到下一行
This is my program						程序打印输出
Process 9992 stopped
* thread #1, name = 'temp', stop reason = step over
    frame #0: 0x0000000000201300 temp`main at temp.c:9:7
   6		int i;
   7
   8		printf("This is my program\n");
-> 9		bazz(i);
   10		return 0;
   11	}
   12
(lldb) thread step-in			进入 bazz()
Process 9992 stopped
* thread #1, name = 'temp', stop reason = step in
    frame #0: 0x000000000020132b temp`bazz(anint=-5360) at temp.c:14:29	lldb 显示堆栈帧
   11	}
   12
   13	int bazz(int anint) {
-> 14		printf("You gave me %d\n", anint);
   15		return anint;
   16	}
(lldb)

等一下！anint 怎么变成了 -5360？它不是在 main() 中被设置为 5 吗？让我们回到 main() 看看。

(lldb) up		返回到调用栈
frame #1: 0x000000000020130b temp`main at temp.c:9:2		lldb 显示堆栈帧
   6		int i;
   7
   8		printf("This is my program\n");
-> 9		bazz(i);
   10		return 0;
   11	}
   12
(lldb) frame variable i			显示 i 的值
(int) i = -5360							lldb 显示 -5360

哦，糟糕！看看代码，我们忘记初始化 i 了。我们本应写成：

...
main() {
	int i;

	i = 5;
	printf("This is my program\n");
...

但我们忘记了 i=5; 这一行。由于没有初始化 i，它就有了程序运行时该内存位置上的任意值，在这种情况下是 -5360。

技巧
每次我们进入或退出一个函数时，lldb 命令都会显示堆栈帧，即使我们使用 up 和 down 移动调用栈时也是如此。这会显示函数的名称和其参数的值，帮助我们跟踪程序的运行情况。（调用栈是程序存储传递给函数的参数和返回时要跳转的位置的存储区域。）

2.6.2.3. 使用 lldb 检查核心文件

核心文件基本上是包含程序崩溃时完整状态的文件。在“好老的日子里”，程序员需要打印出核心文件的十六进制清单，并为机器代码手册而苦苦挣扎，但现在生活变得容易多了。顺便提一下，在 FreeBSD 和其他 4.4BSD 系统中，核心文件被称为 progname.core，而不是仅仅叫 core，以便更清楚地表明核心文件属于哪个程序。

要检查核心文件，需要在指定程序的同时指定核心文件的名称。不要像通常那样启动 lldb，而是输入 lldb -c <progname>.core -- <progname>。

调试器将显示如下内容：

% lldb -c progname.core -- progname
(lldb) target create "progname" --core "progname.core"
Core file '/home/pauamma/tmp/progname.core' (x86_64) was loaded.
(lldb)

在这个例子中，程序被命名为 progname，因此核心文件名为 progname.core。调试器不会显示程序崩溃的原因或位置。为此，可以使用 thread backtrace all。这也会显示导致程序崩溃的函数是如何被调用的。

(lldb) thread backtrace all
 thread #1, name = 'progname', stop reason = signal SIGSEGV
   frame #0: 0x0000000000201347 progname`bazz(anint=5) at temp2.c:17:10
    frame #1: 0x0000000000201312 progname`main at temp2.c:10:2
    frame #2: 0x000000000020110f progname`_start(ap=<unavailable>, cleanup=<unavailable>) at crt1.c:76:7
(lldb)

SIGSEGV 表示程序试图访问其不属于自己的内存（通常是运行代码或读写数据），但没有给出具体细节。为此，可以查看 temp2.c 文件中第 10 行的源代码，查看 bazz() 中的代码。回溯还表明，在此情况下，bazz() 是从 main() 中调用的。

2.6.2.4. 使用 lldb 附加到正在运行的程序

lldb 的一大亮点功能是它可以附加到一个已经在运行的程序上。当然，这要求有足够的权限才能执行此操作。一个常见问题是当程序进行 fork 操作并希望跟踪子进程时，调试器通常只会跟踪父进程。

为此，启动另一个 lldb，使用 ps 查找子进程的进程 ID，然后在 lldb 中执行

(lldb) process attach -p pid

然后像往常一样进行调试。

为了让这个过程顺利工作，调用 fork 创建子进程的代码需要做如下处理（摘自 gdb 的信息页面）：

...
if ((pid = fork()) < 0)		/* _始终_ 检查这个 */
	error();
else if (pid == 0) {		/* 子进程 */
	int PauseMode = 1;

	while (PauseMode)
		sleep(10);	/* 等待直到有人附加到我们 */
	...
} else {			/* 父进程 */
	...

现在，只需要附加到子进程，在 lldb 中执行 expr PauseMode = 0，并等待 sleep() 调用返回。

2.6.3. 使用 LLDB 进行远程调试

注意

从 LLDB 12.0.0 开始，FreeBSD 支持远程调试。这意味着可以在一台主机上启动 lldb-server 来调试程序，而交互式的 lldb 客户端则可以从另一台主机连接到它。

要启动一个需要远程调试的程序，请在远程服务器上运行 lldb-server，命令如下：

% lldb-server g host:port -- progname

程序启动后会立即停止，lldb-server 会等待客户端的连接。

然后，在本地启动 lldb，并输入以下命令来连接到远程服务器：

(lldb) gdb-remote host:port

lldb-server 也可以附加到一个正在运行的进程。要做到这一点，在远程服务器上输入以下命令：

% lldb-server g host:port --attach pid-or-name

2.6.4. 使用 gdb

2.6.4.1. 启动 gdb

通过输入以下命令启动 gdb：

% gdb progname

不过许多人更喜欢在 Emacs 中运行它。要在 Emacs 中运行，输入：

M-x gdb RET progname RET

2.6.4.2. 使用 gdb 运行程序

使用 -g 选项编译程序，以便最大限度地发挥 gdb 的功能。即使不加 -g 选项，gdb 也能工作，但它只会显示当前运行的函数名称，而不是源代码。如果在启动 gdb 时看到类似以下内容：

... (no debugging symbols found) ...

这意味着程序没有使用 -g 编译。

在 gdb 提示符下，输入 break main。这将告诉调试器跳过程序中的初步设置代码，并在程序代码开始时停止执行。接着输入 run 启动程序，程序会从设置代码开始执行，并在调用 main() 时被调试器停止。

要逐行调试程序，可以按 n。当遇到函数调用时，按 s 步入该函数。进入函数后，按 f 返回，或者使用 up 和 down 快速查看调用者。

以下是使用 gdb 找到程序错误的一个简单示例。我们有如下程序（包含一个故意的错误）：

#include <stdio.h>

int bazz(int anint);

main() {
	int i;

	printf("This is my program\n");
	bazz(i);
	return 0;
}

int bazz(int anint) {
	printf("You gave me %d\n", anint);
	return anint;
}

该程序将 i 设置为 5，并将其传递给函数 bazz()，该函数打印出我们给它的数字。

编译并运行该程序，输出为：

% cc -g -o temp temp.c
% ./temp
This is my program
anint = 4231

这不是我们期望的结果！是时候看看发生了什么！

% gdb temp
GDB is free software and you are welcome to distribute copies of it
 under certain conditions; type "show copying" to see the conditions.
There is absolutely no warranty for GDB; type "show warranty" for details.
GDB 4.13 (i386-unknown-freebsd), Copyright 1994 Free Software Foundation, Inc.
(gdb) break main				跳过设置代码
Breakpoint 1 at 0x160f: file temp.c, line 9.	gdb 在 main() 设置断点
(gdb) run					运行到 main()
Starting program: /home/james/tmp/temp		程序开始运行

Breakpoint 1, main () at temp.c:9		gdb 在 main() 停止
(gdb) n						执行下一行
This is my program				程序输出
(gdb) s						步入 bazz()
bazz (anint=4231) at temp.c:17			gdb 显示堆栈帧
(gdb)

等一下！anint 怎么成了 4231？它不是在 main() 中被设置为 5 吗？让我们回到 main()，看看。

(gdb) up					回到调用栈
#1  0x1625 in main () at temp.c:11		gdb 显示堆栈帧
(gdb) p i					显示 i 的值
$1 = 4231					gdb 显示 i 的值是 4231

哦，天哪！查看代码，我们忘记初始化 i 了。我们本来应该写：

...
main() {
	int i;

	i = 5;
	printf("This is my program\n");
...

但我们忘了写 i=5; 这一行。由于没有初始化 i，它包含了程序运行时该内存区域的任意值，而在这个情况下，恰好是 4231。

注意
每次进入或退出一个函数时，gdb 命令都会显示堆栈帧，即使我们使用 up 和 down 来在调用栈中移动。这显示了函数的名称和其参数的值，这有助于我们跟踪当前的位置和发生了什么。（堆栈是程序存储有关传递给函数的参数以及返回时应该去哪里的信息的区域。）

2.6.4.3. 使用 gdb 检查 Core 文件

Core 文件基本上是一个包含程序崩溃时完整状态的文件。在“好久以前”，程序员们不得不打印出 core 文件的十六进制清单，并靠着机器代码手册来调试，但现在生活变得轻松一些。顺便提一下，在 FreeBSD 和其他 4.4BSD 系统中，core 文件被称为 progname.core，而不仅仅是 core，这样可以更清楚地标明哪个程序的 core 文件。

要检查一个 core 文件，像平常一样启动 gdb。不过，不需要输入 break 或 run，而是输入：

(gdb) core progname.core

如果 core 文件不在当前目录中，首先输入 dir /path/to/core/file。

调试器应该会显示如下信息：

% gdb progname
GDB is free software and you are welcome to distribute copies of it
 under certain conditions; type "show copying" to see the conditions.
There is absolutely no warranty for GDB; type "show warranty" for details.
GDB 4.13 (i386-unknown-freebsd), Copyright 1994 Free Software Foundation, Inc.
(gdb) core progname.core
Core was generated by `progname'.
Program terminated with signal 11, Segmentation fault.
Cannot access memory at address 0x7020796d.
#0  0x164a in bazz (anint=0x5) at temp.c:17
(gdb)

在这个例子中，程序名为 progname，因此 core 文件名为 progname.core。我们可以看到程序因为尝试访问一个无法使用的内存区域而崩溃，崩溃发生在 bazz 函数中。

有时查看函数是如何被调用的很有用，因为问题可能出现在复杂程序中的调用栈的更高层。bt 命令会让 gdb 打印出调用栈的回溯信息：

(gdb) bt
#0  0x164a in bazz (anint=0x5) at temp.c:17
#1  0xefbfd888 in end ()
#2  0x162c in main () at temp.c:11
(gdb)

end() 函数在程序崩溃时被调用；在这种情况下，bazz() 函数是从 main() 被调用的。

2.6.4.4. 附加到正在运行的程序

gdb 最酷的功能之一就是它可以附加到一个已经在运行的程序。当然，这需要足够的权限才能做到这一点。一个常见的问题是，在调试一个 fork 的程序时，想要追踪子进程，但调试器只会追踪父进程。

为此，可以启动另一个 gdb，使用 ps 查找子进程的 PID，然后在 gdb 中执行：

(gdb) attach pid

然后像平常一样调试。

为了让这个过程顺利工作，调用 fork 来创建子进程的代码需要像以下这样写（摘自 gdb 的信息页面）：

...
if ((pid = fork()) < 0)		/* _Always_ check this */
	error();
else if (pid == 0) {		/* child */
	int PauseMode = 1;

	while (PauseMode)
		sleep(10);	/* 等待直到有人附加到我们 */
	...
} else {			/* parent */
	...

现在，只需附加到子进程，将 PauseMode 设置为 0，并等待 sleep() 调用返回即可！

2.7. 使用 Emacs 作为开发环境

2.7.1. Emacs

Emacs 是一个高度可定制的编辑器——事实上，它已经被定制到几乎像一个操作系统而不是编辑器的程度！许多开发者和系统管理员确实几乎把所有的时间都花在 Emacs 中，只有在注销时才会离开它。

在这里简要总结 Emacs 能做的所有事情几乎是不可能的，但以下是一些对开发者有用的功能：

非常强大的编辑器，支持对字符串和正则表达式（模式）进行搜索和替换，跳转到代码块的开始/结束等。
下拉菜单和在线帮助。
语言相关的语法高亮和缩进。
完全可定制。
你可以在 Emacs 中编译和调试程序。
当编译出错时，你可以跳转到源代码中的错误行。
提供一个友好的前端来使用 info 程序，阅读 GNU 超文本文档，包括 Emacs 本身的文档。
提供一个友好的前端来使用 gdb，允许你在程序调试时查看源代码。

当然，还有许多其他功能未被列出。

安装完成后，启动 Emacs，输入 C-h t 阅读 Emacs 教程——这意味着按住控制键，按 h 键，松开控制键，然后按 t 键。（或者，你可以使用鼠标从 Help 菜单中选择 Emacs Tutorial。）

尽管 Emacs 有菜单，但学习键绑定非常值得，因为编辑时按几个键比寻找鼠标并点击正确的地方要快得多。而且，当你与经验丰富的 Emacs 用户交谈时，你会发现他们常常随意地说出像“M-x replace-s RET foo RET bar RET”这样的表达方式，所以了解它们的意思很有用。无论如何，Emacs 有太多有用的功能，菜单栏根本容不下所有功能。

幸运的是，学习键绑定非常容易，因为它们会显示在菜单项旁边。我的建议是，首先使用菜单项打开文件，直到你了解它是如何工作的并且对其有信心，然后尝试使用 C-x C-f。当你熟悉这个操作后，再尝试其他菜单命令。

如果你记不住某个特定的键组合，可以从 Help 菜单中选择 Describe Key，然后输入它——Emacs 会告诉你它的功能。你还可以使用 Command Apropos 菜单项，查找包含某个特定单词的所有命令，旁边会显示其键绑定。

顺便说一下，前面的表达式意味着按住 Meta 键，按下 x 键，松开 Meta 键，输入 replace-s（replace-string 的缩写——Emacs 的另一个特点是你可以缩写命令），按回车键，输入 foo（你要替换的字符串），按回车键，输入 bar（你希望用来替换 foo 的字符串），再次按回车。Emacs 会执行你刚刚请求的查找和替换操作。

如果你在想 Meta 键到底是什么，它是许多 UNIX® 工作站上都有的一个特殊键。不幸的是，PC 没有这个键，因此通常使用 alt 键（如果不幸的话，使用 escape 键）。

哦，要退出 Emacs，输入 C-x C-c（这意味着按住控制键，按 x 键，按 c 键，释放控制键）。如果你有任何未保存的文件，Emacs 会询问你是否保存它们。（忽略文档中提到的 C-z 是退出 Emacs 的常用方式——那样会让 Emacs 在后台挂着，只有在没有虚拟终端的系统上才有用。）

2.7.2. 配置 Emacs

Emacs 有许多奇妙的功能；其中一些是内建的，有些则需要配置。

Emacs 并没有使用专有的宏语言来进行配置，而是使用了一种特别为编辑器改编的 Lisp 版本，称为 Emacs Lisp。如果你想学习像 Common Lisp 这样的语言，学习 Emacs Lisp 是非常有帮助的。Emacs Lisp 具有许多 Common Lisp 的特性，尽管它要小得多（因此更容易掌握）。

不过，实际上并不需要懂 Lisp 就可以开始配置 Emacs，因为我提供了一个示例 .emacs 文件，应该足以让你入门。只需将它复制到你的主目录中，并重新启动 Emacs（如果已经运行的话）；它会读取文件中的命令，并（希望）为你提供一个有用的基本设置。

2.7.3. 示例 .emacs

不幸的是，这里有太多内容需要详细解释；然而，有一两个值得一提的要点。

以 ; 开头的所有内容都是注释，Emacs 会忽略它们。
在第一行，-<strong>- Emacs-Lisp -</strong>- 是为了使我们能够在 Emacs 内部编辑 .emacs 文件，并获得所有编辑 Emacs Lisp 的高级功能。Emacs 通常会根据文件名尝试猜测这一点，但可能不会为 .emacs 文件正确识别。
Tab 键在某些模式下绑定到缩进功能，因此当你按下 Tab 键时，它会缩进当前的代码行。如果你想在写的内容中插入一个 Tab 字符，可以在按 Tab 键时按住控制键。
该文件支持 C、C++、Perl、Lisp 和 Scheme 的语法高亮，通过从文件名猜测语言来启用。
Emacs 已经有一个预定义的函数 next-error。在编译输出窗口中，它允许你通过执行 M-n 从一个编译错误跳到下一个；我们定义了一个互补函数 previous-error，允许你通过执行 M-p 跳转到前一个错误。最好的功能是，C-c C-c 会打开发生错误的源文件并跳转到相应的行。
我们启用 Emacs 的服务器功能，这样，如果你在 Emacs 之外做一些事情，想要编辑一个文件，只需输入
```
% emacsclient filename
```

示例 1 .emacs

;; -*-Emacs-Lisp-*-

;; This file is designed to be re-evaled; use the variable first-time
;; to avoid any problems with this.
(defvar first-time t
  "Flag signifying this is the first time that .emacs has been evaled")

;; Meta
(global-set-key "\M- " 'set-mark-command)
(global-set-key "\M-\C-h" 'backward-kill-word)
(global-set-key "\M-\C-r" 'query-replace)
(global-set-key "\M-r" 'replace-string)
(global-set-key "\M-g" 'goto-line)
(global-set-key "\M-h" 'help-command)

;; Function keys
(global-set-key [f1] 'manual-entry)
(global-set-key [f2] 'info)
(global-set-key [f3] 'repeat-complex-command)
(global-set-key [f4] 'advertised-undo)
(global-set-key [f5] 'eval-current-buffer)
(global-set-key [f6] 'buffer-menu)
(global-set-key [f7] 'other-window)
(global-set-key [f8] 'find-file)
(global-set-key [f9] 'save-buffer)
(global-set-key [f10] 'next-error)
(global-set-key [f11] 'compile)
(global-set-key [f12] 'grep)
(global-set-key [C-f1] 'compile)
(global-set-key [C-f2] 'grep)
(global-set-key [C-f3] 'next-error)
(global-set-key [C-f4] 'previous-error)
(global-set-key [C-f5] 'display-faces)
(global-set-key [C-f8] 'dired)
(global-set-key [C-f10] 'kill-compilation)

;; Keypad bindings
(global-set-key [up] "\C-p")
(global-set-key [down] "\C-n")
(global-set-key [left] "\C-b")
(global-set-key [right] "\C-f")
(global-set-key [home] "\C-a")
(global-set-key [end] "\C-e")
(global-set-key [prior] "\M-v")
(global-set-key [next] "\C-v")
(global-set-key [C-up] "\M-\C-b")
(global-set-key [C-down] "\M-\C-f")
(global-set-key [C-left] "\M-b")
(global-set-key [C-right] "\M-f")
(global-set-key [C-home] "\M-<")
(global-set-key [C-end] "\M->")
(global-set-key [C-prior] "\M-<")
(global-set-key [C-next] "\M->")

;; Mouse
(global-set-key [mouse-3] 'imenu)

;; Misc
(global-set-key [C-tab] "\C-q\t")	; Control tab quotes a tab.
(setq backup-by-copying-when-mismatch t)

;; Treat 'y' or <CR> as yes, 'n' as no.
(fset 'yes-or-no-p 'y-or-n-p)
(define-key query-replace-map [return] 'act)
(define-key query-replace-map [?\C-m] 'act)

;; Load packages
(require 'desktop)
(require 'tar-mode)

;; Pretty diff mode
(autoload 'ediff-buffers "ediff" "Intelligent Emacs interface to diff" t)
(autoload 'ediff-files "ediff" "Intelligent Emacs interface to diff" t)
(autoload 'ediff-files-remote "ediff"
  "Intelligent Emacs interface to diff")

(if first-time
    (setq auto-mode-alist
	  (append '(("\\.cpp$" . c++-mode)
		    ("\\.hpp$" . c++-mode)
		    ("\\.lsp$" . lisp-mode)
		    ("\\.scm$" . scheme-mode)
		    ("\\.pl$" . perl-mode)
		    ) auto-mode-alist)))

;; Auto font lock mode
(defvar font-lock-auto-mode-list
  (list 'c-mode 'c++-mode 'c++-c-mode 'emacs-lisp-mode 'lisp-mode 'perl-mode 'scheme-mode)
  "List of modes to always start in font-lock-mode")

(defvar font-lock-mode-keyword-alist
  '((c++-c-mode . c-font-lock-keywords)
    (perl-mode . perl-font-lock-keywords))
  "Associations between modes and keywords")

(defun font-lock-auto-mode-select ()
  "Automatically select font-lock-mode if the current major mode is in font-lock-auto-mode-list"
  (if (memq major-mode font-lock-auto-mode-list)
      (progn
	(font-lock-mode t))
    )
  )

(global-set-key [M-f1] 'font-lock-fontify-buffer)

;; New dabbrev stuff
;(require 'new-dabbrev)
(setq dabbrev-always-check-other-buffers t)
(setq dabbrev-abbrev-char-regexp "\\sw\\|\\s_")
(add-hook 'emacs-lisp-mode-hook
	  '(lambda ()
	     (set (make-local-variable 'dabbrev-case-fold-search) nil)
	     (set (make-local-variable 'dabbrev-case-replace) nil)))
(add-hook 'c-mode-hook
	  '(lambda ()
	     (set (make-local-variable 'dabbrev-case-fold-search) nil)
	     (set (make-local-variable 'dabbrev-case-replace) nil)))
(add-hook 'text-mode-hook
	  '(lambda ()
	     (set (make-local-variable 'dabbrev-case-fold-search) t)
	     (set (make-local-variable 'dabbrev-case-replace) t)))

;; C++ and C mode...
(defun my-c++-mode-hook ()
  (setq tab-width 4)
  (define-key c++-mode-map "\C-m" 'reindent-then-newline-and-indent)
  (define-key c++-mode-map "\C-ce" 'c-comment-edit)
  (setq c++-auto-hungry-initial-state 'none)
  (setq c++-delete-function 'backward-delete-char)
  (setq c++-tab-always-indent t)
  (setq c-indent-level 4)
  (setq c-continued-statement-offset 4)
  (setq c++-empty-arglist-indent 4))

(defun my-c-mode-hook ()
  (setq tab-width 4)
  (define-key c-mode-map "\C-m" 'reindent-then-newline-and-indent)
  (define-key c-mode-map "\C-ce" 'c-comment-edit)
  (setq c-auto-hungry-initial-state 'none)
  (setq c-delete-function 'backward-delete-char)
  (setq c-tab-always-indent t)
;; BSD-ish indentation style
  (setq c-indent-level 4)
  (setq c-continued-statement-offset 4)
  (setq c-brace-offset -4)
  (setq c-argdecl-indent 0)
  (setq c-label-offset -4))

;; Perl mode
(defun my-perl-mode-hook ()
  (setq tab-width 4)
  (define-key c++-mode-map "\C-m" 'reindent-then-newline-and-indent)
  (setq perl-indent-level 4)
  (setq perl-continued-statement-offset 4))

;; Scheme mode...
(defun my-scheme-mode-hook ()
  (define-key scheme-mode-map "\C-m" 'reindent-then-newline-and-indent))

;; Emacs-Lisp mode...
(defun my-lisp-mode-hook ()
  (define-key lisp-mode-map "\C-m" 'reindent-then-newline-and-indent)
  (define-key lisp-mode-map "\C-i" 'lisp-indent-line)
  (define-key lisp-mode-map "\C-j" 'eval-print-last-sexp))

;; Add all of the hooks...
(add-hook 'c++-mode-hook 'my-c++-mode-hook)
(add-hook 'c-mode-hook 'my-c-mode-hook)
(add-hook 'scheme-mode-hook 'my-scheme-mode-hook)
(add-hook 'emacs-lisp-mode-hook 'my-lisp-mode-hook)
(add-hook 'lisp-mode-hook 'my-lisp-mode-hook)
(add-hook 'perl-mode-hook 'my-perl-mode-hook)

;; Complement to next-error
(defun previous-error (n)
  "Visit previous compilation error message and corresponding source code."
  (interactive "p")
  (next-error (- n)))

;; Misc...
(transient-mark-mode 1)
(setq mark-even-if-inactive t)
(setq visible-bell nil)
(setq next-line-add-newlines nil)
(setq compile-command "make")
(setq suggest-key-bindings nil)
(put 'eval-expression 'disabled nil)
(put 'narrow-to-region 'disabled nil)
(put 'set-goal-column 'disabled nil)
(if (>= emacs-major-version 21)
	(setq show-trailing-whitespace t))

;; Elisp archive searching
(autoload 'format-lisp-code-directory "lispdir" nil t)
(autoload 'lisp-dir-apropos "lispdir" nil t)
(autoload 'lisp-dir-retrieve "lispdir" nil t)
(autoload 'lisp-dir-verify "lispdir" nil t)

;; Font lock mode
(defun my-make-face (face color &optional bold)
  "Create a face from a color and optionally make it bold"
  (make-face face)
  (copy-face 'default face)
  (set-face-foreground face color)
  (if bold (make-face-bold face))
  )

(if (eq window-system 'x)
    (progn
      (my-make-face 'blue "blue")
      (my-make-face 'red "red")
      (my-make-face 'green "dark green")
      (setq font-lock-comment-face 'blue)
      (setq font-lock-string-face 'bold)
      (setq font-lock-type-face 'bold)
      (setq font-lock-keyword-face 'bold)
      (setq font-lock-function-name-face 'red)
      (setq font-lock-doc-string-face 'green)
      (add-hook 'find-file-hooks 'font-lock-auto-mode-select)

      (setq baud-rate 1000000)
      (global-set-key "\C-cmm" 'menu-bar-mode)
      (global-set-key "\C-cms" 'scroll-bar-mode)
      (global-set-key [backspace] 'backward-delete-char)
					;      (global-set-key [delete] 'delete-char)
      (standard-display-european t)
      (load-library "iso-transl")))

;; X11 or PC using direct screen writes
(if window-system
    (progn
      ;;      (global-set-key [M-f1] 'hilit-repaint-command)
      ;;      (global-set-key [M-f2] [?\C-u M-f1])
      (setq hilit-mode-enable-list
	    '(not text-mode c-mode c++-mode emacs-lisp-mode lisp-mode
		  scheme-mode)
	    hilit-auto-highlight nil
	    hilit-auto-rehighlight 'visible
	    hilit-inhibit-hooks nil
	    hilit-inhibit-rebinding t)
      (require 'hilit19)
      (require 'paren))
  (setq baud-rate 2400)			; For slow serial connections
  )

;; TTY type terminal
(if (and (not window-system)
	 (not (equal system-type 'ms-dos)))
    (progn
      (if first-time
	  (progn
	    (keyboard-translate ?\C-h ?\C-?)
	    (keyboard-translate ?\C-? ?\C-h)))))

;; Under UNIX
(if (not (equal system-type 'ms-dos))
    (progn
      (if first-time
	  (server-start))))

;; Add any face changes here
(add-hook 'term-setup-hook 'my-term-setup-hook)
(defun my-term-setup-hook ()
  (if (eq window-system 'pc)
      (progn
;;	(set-face-background 'default "red")
	)))

;; Restore the "desktop" - do this as late as possible
(if first-time
    (progn
      (desktop-load-default)
      (desktop-read)))

;; Indicate that this file has been read at least once
(setq first-time nil)

;; No need to debug anything now

(setq debug-on-error nil)

;; All done
(message "All done, %s%s" (user-login-name) ".")

2.7.4. 扩展 Emacs 支持的语言范围

如果你只想在 .emacs 中使用已经支持的语言（C、C++、Perl、Lisp 和 Scheme），那是很好，但如果有一种新的语言叫做 "whizbang" 出现，充满了激动人心的功能，该怎么办呢？

首先要做的是查看 whizbang 是否附带了任何可以让 Emacs 了解该语言的文件。通常这些文件的扩展名是 .el，即 "Emacs Lisp" 的缩写。例如，如果 whizbang 是一个 FreeBSD port，我们可以通过以下命令来查找这些文件：

% find /usr/ports/lang/whizbang -name "*.el" -print

然后将这些文件复制到 Emacs 的 site-lisp 目录中进行安装。在 FreeBSD 中，site-lisp 目录是 /usr/local/share/emacs/site-lisp。

例如，如果 find 命令的输出是：

/usr/ports/lang/whizbang/work/misc/whizbang.el

那么我们应该执行：

# cp /usr/ports/lang/whizbang/work/misc/whizbang.el /usr/local/share/emacs/site-lisp

接下来，我们需要决定 whizbang 源文件的扩展名是什么。假设它们都以 .wiz 结尾。我们需要在 .emacs 中添加一条记录，确保 Emacs 能够使用 whizbang.el 中的信息。

找到 .emacs 中的 auto-mode-alist 条目，然后添加一行，如下所示：

...
("\\.lsp$" . lisp-mode)
("\\.wiz$" . whizbang-mode)
("\\.scm$" . scheme-mode)
...

这意味着当你编辑一个以 .wiz 结尾的文件时，Emacs 会自动进入 whizbang-mode。

接下来，在 .emacs 中找到 font-lock-auto-mode-list 条目。像这样将 whizbang-mode 添加到其中：

;; 自动字体锁定模式
(defvar font-lock-auto-mode-list
  (list 'c-mode 'c++-mode 'c++-c-mode 'emacs-lisp-mode 'whizbang-mode 'lisp-mode 'perl-mode 'scheme-mode)
  "始终启用字体锁定模式的模式列表")

这意味着当编辑一个 .wiz 文件时，Emacs 会始终启用 font-lock-mode（即语法高亮）。

就这样，完成了所有必要的设置。如果你希望在打开 .wiz 文件时自动执行其他操作，可以添加一个 whizbang-mode hook（参见 my-scheme-mode-hook，这是一个简单的例子，添加了 auto-indent）。

2.8. 进一步阅读

Brian Harvey 和 Matthew Wright Simply Scheme MIT 1994. ISBN 0-262-08226-8
Randall Schwartz Learning Perl O’Reilly 1993 ISBN 1-56592-042-2
Patrick Henry Winston 和 Berthold Klaus Paul Horn Lisp (3rd Edition) Addison-Wesley 1989 ISBN 0-201-08319-1
Brian W. Kernighan 和 Rob Pike The Unix Programming Environment Prentice-Hall 1984 ISBN 0-13-937681-X
Brian W. Kernighan 和 Dennis M. Ritchie The C Programming Language (2nd Edition) Prentice-Hall 1988 ISBN 0-13-110362-8
Bjarne Stroustrup The C++ Programming Language Addison-Wesley 1991 ISBN 0-201-53992-6
W. Richard Stevens Advanced Programming in the Unix Environment Addison-Wesley 1992 ISBN 0-201-56317-7
W. Richard Stevens Unix Network Programming Prentice-Hall 1990 ISBN 0-13-949876-1

第 3 章安全编程

3.1. 概要

本章描述了一些困扰 UNIX® 程序员数十年的安全问题，以及一些帮助程序员避免编写可被利用代码的新工具。

3.2. 安全设计方法论

编写安全的应用程序需要一种极其谨慎和悲观的世界观。应用程序应遵循“最小权限”原则运行，使得任何进程运行时都不拥有超过其完成功能所需的最小访问权限。应尽可能重用之前经过测试的代码，以避免他人已经修复过的常见错误。

UNIX® 环境的一个陷阱是，很容易对环境的健全性做出假设。应用程序绝不应信任用户输入（无论以何种形式）、系统资源、进程间通信或事件的时序。UNIX® 进程不是同步执行的，因此逻辑操作很少是原子的。

3.3. 缓冲区溢出

缓冲区溢出从冯·诺依曼架构诞生之初便已存在。它们在 1988 年因 Morris Internet 蠕虫而首次广泛引起关注。不幸的是，这种基本攻击方式至今仍然有效。迄今为止，最常见的缓冲区溢出攻击类型是基于破坏栈的攻击。

大多数现代计算机系统使用栈来向过程传递参数并存储局部变量。栈是一种先进后出（LIFO）的缓冲区，位于进程映像的高地址内存区域。当程序调用一个函数时，会创建一个新的“栈帧”。这个栈帧由传递给函数的参数以及一块动态大小的局部变量空间组成。“栈指针”是一个寄存器，保存当前栈顶的位置。由于这个值在新数据不断压入栈顶时不断变化，许多实现还提供一个“帧指针”，它位于栈帧的开头附近，以便更容易以它为基准寻址局部变量。函数调用的返回地址也存储在栈上，这正是栈溢出攻击的根源 —— 因为函数中局部变量的溢出可以覆盖该函数的返回地址，可能允许恶意用户执行任意代码。

虽然基于栈的攻击最为常见，但也有可能通过堆（malloc/free）实现栈的溢出。

C 编程语言不像许多其他语言那样对数组或指针执行自动边界检查。此外，标准 C 库中充斥着一些非常危险的函数：

3.3.1. 缓冲区溢出示例

我们来看看，如果向这个小程序输入 160 个空格再按回车，这个进程的内存映像会是什么样子。

显然，可以设计出更具恶意的输入来执行实际的已编译指令（例如执行 exec(/bin/sh)）。

3.3.2. 避免缓冲区溢出

解决栈溢出问题最直接的办法是始终使用带有长度限制的内存和字符串复制函数。strncpy 和 strncat 是标准 C 库的一部分。这些函数接受一个长度参数，该参数应不大于目标缓冲区的大小。这些函数会从源复制最多 “length” 个字节到目标中。但这些函数存在多个问题。若输入数据的长度与目标缓冲区相等，它们都不保证以 NUL 结尾。此外，这两个函数在长度参数上的语义不一致，程序员很容易混淆使用方法。若将短字符串复制到一个大缓冲区，与 strcpy 相比，这些函数的性能也大打折扣，因为 strncpy 会用 NUL 填满指定大小。

为了解决这些问题，出现了另一组内存复制实现：strlcpy 和 strlcat。这些函数在传入非零长度参数时，始终保证目标字符串以 null 结尾。

3.3.2.1. 基于编译器的运行时边界检查

不幸的是，目前仍有大量代码在不使用任何边界限制复制函数的情况下盲目地进行内存拷贝。幸运的是，存在一种方式可以帮助防止此类攻击 —— 编译器实现的运行时边界检查。

ProPolice 通过在调用函数之前在栈的关键区域放置伪随机数来防止基于栈的缓冲区溢出及其他攻击。当函数返回时，这些“金丝雀值”会被检查，如果发现已被更改，程序会立即中止。因此，任何试图修改返回地址或栈上其他变量以执行恶意代码的行为都极不可能成功，因为攻击者还必须设法保持这些伪随机金丝雀值不被破坏。

使用 ProPolice 重新编译应用程序是防止大多数缓冲区溢出攻击的有效手段，尽管仍有被绕过的可能。

3.3.2.2. 基于库的运行时边界检查

对于无法重新编译的二进制软件，编译器机制完全无效。在这种情况下，有一些库对 C 库中的不安全函数（如 strcpy、fscanf、getwd 等）进行了重新实现，并确保这些函数绝不会写越过栈指针。

libsafe
libverify
libparanoia

不幸的是，这些基于库的防护措施存在一些缺陷。这些库仅能防御极少数与安全相关的问题，并未修复实际根本问题。如果应用程序使用了 -fomit-frame-pointer 编译选项，这些防护可能会失效。此外，用户可以覆盖或取消设置 LD_PRELOAD 和 LD_LIBRARY_PATH 环境变量，从而绕过这些防护。

3.4. SetUID 问题

每个进程至少关联有 6 个不同的 ID，因此必须非常谨慎地控制进程在任意时刻所拥有的访问权限。尤其是，所有调用 seteuid 的应用程序应在权限不再需要时立即放弃这些权限。

真实用户 ID 只能由超级用户进程更改。用户初次登录时由登录程序设置此 ID，之后很少再改变。

有效用户 ID 是在程序具有 setuid 位时由 exec() 函数设置的。应用程序可以随时调用 seteuid()，将有效用户 ID 设置为真实用户 ID 或保存的 set-user-ID。当 exec() 函数设置有效用户 ID 时，先前的值会保存在保存的 set-user-ID 中。

3.5. 限制程序运行环境

限制进程的传统方法是使用 chroot() 系统调用。此调用会改变进程及其所有子进程所引用路径的根目录。要使该调用成功，进程必须对所引用目录具有执行（搜索）权限。新环境实际上要等到调用 chdir() 进入新目录后才会生效。还应注意，如果进程拥有 root 权限，是可以轻易逃出 chroot 环境的。例如可以通过创建设备节点读取内核内存，或将调试器附加到 chroot 环境之外的进程，或用其他多种创造性方式实现逃脱。

可以通过 sysctl 变量 kern.chroot_allow_open_directories 对 chroot() 系统调用的行为进行一定控制。当此值设置为 0 时，如果有任何目录是打开的，chroot() 将以 EPERM 失败。若设置为默认值 1，则在进程已经处于 chroot() 环境下且存在任何打开的目录时，chroot() 将以 EPERM 失败。若设置为其他值，则完全跳过对打开目录的检查。

3.5.1. FreeBSD 的 jail 功能

Jail 的概念在 chroot() 的基础上扩展，通过限制超级用户的权限来创建一个真正的“虚拟服务器”。一旦设置了 jail，所有网络通信都必须通过指定的 IP 地址进行，而该 jail 中的“root 权限”被大大限制。

在 jail 中，任何在内核中使用 suser() 调用进行的超级用户权限测试都会失败。不过，一些对 suser() 的调用已经被替换成了新的接口 suser_xxx()。这个函数负责识别或拒绝 jail 中进程对超级用户权限的访问。

处于 jail 环境中的超级用户进程仍然拥有以下权限：

使用 setuid、seteuid、setgid、setegid、setgroups、setreuid、setregid、setlogin 操作凭据；
使用 setrlimit 设置资源限制；
修改某些 sysctl 节点（如 kern.hostname）；
执行 chroot()；
设置 vnode 的标志位：chflags、fchflags；
设置 vnode 的属性，如文件权限、所有者、组、大小、访问时间和修改时间；
在 Internet 域中绑定特权端口（端口号小于 1024）。

Jail 是一个非常有用的工具，可以在安全的环境中运行应用程序，但它也有一些不足。目前，IPC 机制尚未转换为 suser_xxx 接口，因此某些应用（如 MySQL）无法在 jail 中运行。虽然 jail 中的超级用户权限被大大限制，但目前还无法精确地定义“限制到什么程度”。

3.5.2. POSIX®·1e 进程能力

POSIX® 已发布一份工作草案，添加了事件审计、访问控制列表、细粒度权限、信息标记和强制访问控制等内容。

3.6. 信任

应用程序永远不应该假设用户环境中的任何内容是可靠的。这包括（但不限于）：用户输入、信号、环境变量、资源、IPC、内存映射、文件系统工作目录、文件描述符、打开的文件数量等。

你永远不应假设可以捕获用户可能提供的所有非法输入。相反，应用程序应当使用正向过滤，仅允许你认为安全的特定输入子集。数据验证不当已经成为许多漏洞的根源，尤其是在面向万维网的 CGI 脚本中。对于文件名，应当格外注意路径（如 "../"、"/"）、符号链接和 shell 转义字符。

Perl 有一个非常强大的特性叫做 “Taint 模式”，可以防止脚本在不安全的方式下使用来自程序外部的数据。该模式会检查命令行参数、环境变量、本地化信息、某些系统调用的返回值（如 readdir()、readlink()、getpwxxx()）以及所有文件输入。

3.7. 竞争条件

竞争条件是一种由于对事件相对时序的意外依赖而导致的异常行为。换句话说，程序员错误地假设某个事件总是会在另一个事件之前发生。

竞争条件的一些常见原因包括信号、访问检查和文件打开操作。信号本质上是异步事件，因此在处理它们时必须特别小心。使用 access(2) 进行权限检查后再调用 open(2) 显然不是原子操作。用户可能会在两次调用之间移动文件。因此，有特权的应用程序应该先调用 seteuid()，然后直接使用 open()。同理，应用程序在调用 open() 前应始终设置合适的 umask，从而避免不必要的 chmod() 调用。

第 4 章本地化和国际化——L10N 和 I18N

4.1. 编写符合 I18N 标准的程序

为了让您的程序对其他语言用户更加实用，我们希望您能够按照 I18N 标准进行编程。GNU 的 gcc 编译器和像 QT、GTK 这样的图形界面库通过对字符串的特殊处理来支持 I18N。编写符合 I18N 的程序非常简单，这也使得其他人可以迅速将您的程序移植到其他语言。请参考特定库的 I18N 文档以获取更多细节。

与普遍认知相反，编写符合 I18N 的代码其实很容易。通常这只是将您的字符串包装在特定库的函数中。此外，请确保支持宽字符或多字节字符。

4.1.1. 统一 I18N 努力的呼声

我们注意到，各个国家的 I18N/L10N 工作经常在重复彼此的劳动。我们中很多人一次又一次地在低效地重复造轮子。我们希望 I18N 领域的主要群体能聚集起来，形成类似 Core Team 所负责的那种统一协作。

当前，我们希望您在编写或移植 I18N 程序时，能将其发送到每个国家相关的 FreeBSD 邮件列表中进行测试。未来，我们希望创建出无需任何脏补丁即可在所有语言中工作的应用程序。

4.1.2. Perl 与 Python

Perl 和 Python 拥有 I18N 和宽字符处理库。请在进行 I18N 编程时使用它们。

4.2. 使用 POSIX.1 本地语言支持（NLS）实现消息本地化

在支持各种输入编码和国家惯例（如不同的小数点符号）这些基础 I18N 功能之上，更高级的 I18N 还可以对程序输出的消息进行本地化。一种常见的做法是使用 POSIX.1 NLS 函数，这些函数作为 FreeBSD 基本系统的一部分提供。

4.2.1. 将本地化消息组织成目录文件

POSIX.1 NLS 基于目录文件（catalog file），这些文件使用所需编码格式包含本地化的消息。消息被组织成若干集合，每条消息在其所属集合中通过一个整数编号标识。目录文件的命名惯例是使用包含的语言环境名，加上 .msg 扩展名。例如，ISO8859-2 编码的匈牙利语消息应该存储在名为 hu_HU.ISO8859-2 的文件中。

这些目录文件是普通文本文件，包含带编号的消息。可以通过在行首添加 $ 符号写注释。集合边界也通过特殊注释分隔，其中 set 关键字必须紧跟在 $ 符号之后，然后是集合编号。例如：

4.2.2. 在源代码中使用目录文件

第二个参数是一个常量，有两个取值：

NL_CAT_LOCALE，表示目录文件基于 LC_MESSAGES。
0，表示使用 LANG 环境变量查找目录文件。

4.2.3. 一个实际示例

以下示例展示了如何以灵活方式使用 NLS 目录。

首先，将以下代码行放入程序的公共头文件中，并在所有需要本地化消息的源文件中包含该头文件：

接着，将以下代码放入主源文件的全局声明部分：

最后是打开、读取和关闭目录文件的实际代码片段：

4.2.3.1. 减少需要本地化的字符串数量

有一个很好的方法可以减少需要本地化的字符串数量，就是使用 libc 的错误信息。这也有助于避免重复，并为许多程序可能遇到的常见错误提供一致的错误信息。

首先，下面是一个没有使用 libc 错误信息的例子：

这个例子可以改写为通过读取 errno 并据此打印错误信息来输出错误：

在这个例子中，自定义字符串被省略了，因此翻译人员在本地化程序时的工作量会更少，用户在遇到这个错误时将看到熟悉的 “Not a directory” 错误信息。这条信息对他们来说可能更为熟悉。请注意，为了直接访问 errno，必须包含 errno.h。

值得注意的是，有些情况下 errno 会由前面的调用自动设置，因此不需要显式设置：

4.2.4. 使用 bsd.nls.mk

使用目录文件需要一些重复的步骤，例如编译目录文件并将其安装到正确的位置。为了进一步简化这一过程，bsd.nls.mk 引入了一些宏。无需显式包含 bsd.nls.mk，它会由常见的 Makefile（例如 bsd.prog.mk 或 bsd.lib.mk）自动包含进来。

第 5 章. 源代码树准则与规范

该章节记录了 FreeBSD 源码树中施行的各种指南和政策。

5.1. 编码风格指南

5.2. Makefile 中的 `MAINTAINER`

如果 FreeBSD src/ 分发中的某个部分由某个人或一组人维护，这会通过 src/MAINTAINERS 文件中的一条记录来表达。Ports Collection 中某个 Port 的维护者通过在该 Port 的 Makefile 中添加一行 MAINTAINER 来向外界表明其维护权：

技巧
对于仓库中的其他部分，或没有指定维护者的部分，或当你不确定谁是活跃的维护者时，可以尝试查看源码树相关部分的最近提交历史。很多时候，并没有明确指定某个维护者，但过去几年中持续活跃于某个源码树部分的人通常也愿意审阅更改。即使文档或源码中没有特别说明，请求审阅作为一种礼貌行为也是非常合理的。

维护者的职责如下：

维护者拥有该代码的所有权，并对其负责。这意味着他/她需要修复与该部分代码相关的 bug 并回应问题报告；如果是引入的第三方软件，还需按需跟踪新版本。
如果某个目录指定了维护者，那么对该目录的更改在提交前应送审给维护者。只有在多次发送邮件仍长时间未收到回复时，才可在未经审阅的情况下提交。但建议尽可能还是请其他人进行审阅。
当然，未经同意不能将某个人或团队添加为维护者。另一方面，维护者不必是 committer，也可以是一个团队。

5.3. 引入的软件（Contributed Software）

管理引入软件的标准做法是创建一个 vendor 分支，在该分支中可以以“干净”方式导入软件（即不加修改），并以版本控制的方式跟踪更新。然后将 vendor 分支中的内容应用到源码树中，并可进行本地修改。FreeBSD 专属的构建集成代码应保存在源码树中，而非 vendor 分支中。

引入软件通常放置在源码树的 contrib/ 子目录中，也有一些例外。仅由内核使用的引入软件位于 sys/contrib/ 之下。

注意
由于会增加后续版本导入的难度，因此在仍然跟踪 vendor 分支的文件上，强烈不建议 进行次要的、无关紧要的或纯粹为美观的修改。

5.3.1. Vendor 导入

5.4. 受限文件（Encumbered Files）

有时可能需要将受限文件添加到 FreeBSD 源码树中。例如，如果某个设备在运行前需要加载一段我们没有源代码的小型二进制代码，那么这个二进制文件就被视为受限文件。下面是将受限文件纳入 FreeBSD 源码树所需遵循的政策：

任何由系统 CPU 执行或解释、且不是源代码格式的文件都属于受限文件。
任何授权比 BSD 或 GNU 更严格的文件都属于受限文件。
包含供硬件使用的可下载二进制数据的文件不被视为受限文件，除非第 (1) 或 (2) 条适用于它。
受限文件应放在 src/contrib 或 src/sys/contrib。
整个模块应保持完整。除非与非受限代码有代码共享，否则无需拆分。
过去二进制文件通常是 uuencode 编码的，并命名为 arch/filename.o.uu。这已不再必要，现在可以直接将二进制文件原样加入仓库。
内核文件：
1. 应始终在 conf/files.* 中列出（为简化构建）。
3. 是否纳入发行版由 Release Engineer 决定。
用户态文件：

5.5. 共享库

如果你要为某个 Port 或其他软件添加共享库支持，而该软件原本并不使用共享库，那么其版本号应遵循以下规则。通常，这些版本号与软件的发行版本无关。

对于 Port：

优先使用上游已经指定的版本号。
如果上游提供了符号版本控制（symbol versioning），应确保我们也使用其脚本。

对于 base 系统：

库版本号从 1 开始。
强烈建议为新库添加符号版本控制。
若存在不兼容的更改，应使用符号版本控制并保持向后 ABI 兼容性。
如果无法做到这一点，或者库没有使用符号版本控制，则需要提升库的版本号。
若需提升 symbol-versioned 库的版本号，必须事先与 Release Engineering 团队协商，说明为何这一更改如此重要，以致必须突破 ABI 兼容限制。

例如，添加函数或修复接口不变的 bug 都可以接受；但删除函数、改变函数调用语法等行为要么需要提供向后兼容的符号版本，要么需要提升主版本号。

更改库版本是提交者的责任。

ELF 动态链接器会精确匹配库名。目前的流行做法是将库名设为 libexample.so.x.y，其中 x 为主版本号，y 为次版本号。惯例是将库的 soname（ELF 中的 DT_SONAME 标签）设为 libexample.so.x，并在安装时建立符号链接：libexample.so.x → libexample.so.x.y，libexample.so → libexample.so.x。这样，静态链接器在使用 -lexample 选项时，会自动链接到正确的库。几乎所有流行的构建系统都会自动采用这种方式。

第 6 章回归测试与性能测试

回归测试用于针对系统中的特定部分进行测试，以确认其按预期运行，并确保旧的错误不会被重新引入。

FreeBSD 的回归测试工具可以在 FreeBSD 源码树中的 src/tools/regression 目录下找到。

6.1. 微基准测试检查清单

本节包含在 FreeBSD 上或对 FreeBSD 本身进行正确微基准测试的建议。

并非每次测试都能用到以下所有建议，但使用得越多，基准测试检测微小差异的能力就越强。

禁用 APM 以及任何其他形式的时钟干预（ACPI？）。
最小化磁盘 I/O，若可行则完全避免。
不要挂载不需要的文件系统。
如果可能，将 /、/usr 以及其他文件系统挂载为只读。这可以避免因访问时间（atime）更新而引起的磁盘 I/O 干扰。
在每次测试迭代之间重启系统，以保证状态一致。
从内核中移除所有非必要的设备驱动程序。例如，如果测试中不需要 USB，就不要在内核中加入 USB。驱动程序往往有计时器在运行。
如果不是测试网络，测试前不要配置网络，或者测试结束后再将结果发出。
禁用“Turbo 模式”，因为它会根据环境调整时钟频率。这意味着即使代码完全相同，基准测试结果也可能因时间、饮品甚至办公室里其他人的存在而不同。

如果系统必须连接公共网络，要注意广播流量的突发峰值。虽然几乎察觉不到，但它仍然会占用 CPU 周期。多播（Multicast）也存在类似问题。

将每个文件系统放在单独的磁盘上，减少因磁头寻道优化带来的抖动。
尽量减少串口或 VGA 控制台的输出。将输出写入文件可减少抖动。（串口控制台容易成为瓶颈。）测试过程中不要触碰键盘，哪怕是空格或退格键也会影响结果。
保证测试时间足够长，但不要太长。若测试太短，时间戳精度不足；若太长，温度变化和晶体频率漂移会影响结果。经验法则：不少于 1 分钟，不超过 1 小时。
每个测试至少运行 3 次，最好是“修改前”和“修改后”都运行超过 20 次。如有可能，交叉运行（例如：不要先运行 20 次“前”，再运行 20 次“后”），这样有助于识别环境因素。不要按 1:1 交替运行，而是 3:3，有助于发现交互效应。

推荐模式为：bababa{bbbaaa}*。这样，前 1+1 次就能初步判断趋势（若完全跑偏可及时终止测试），3+3 次可以估算标准差（决定是否值得长时间运行），后续数据可用于趋势和交互分析。

如果基准测试表现异常差，检查是否有异常的中断源导致的中断量暴增。有报告指出部分 ACPI 版本存在“异常行为”，会产生过多中断。为诊断异常测试结果，可以用 vmstat -i 拍几张快照，看看有没有异常。
注意内核和用户空间的优化参数，以及调试选项。很容易不小心遗漏某项，最后发现测试内容不一致。

6.2. FreeBSD 源码 Tinderbox

Tinderbox 包括以下部分：

一个构建脚本 tinderbox，自动签出指定版本的 FreeBSD 源码树并构建。
一个监督脚本 tbmaster，监视各个 Tinderbox 实例、记录输出，并发送失败通知邮件。
一个名为 index.cgi 的 CGI 脚本，用于读取 tbmaster 日志并以 HTML 格式生成简洁易读的摘要。
一组持续构建 FreeBSD 各主要代码分支最新状态的构建服务器。
一个网页服务器，用于保存完整的 Tinderbox 日志，并显示最新摘要信息。

关于 tinderbox 和 tbmaster 脚本的更多信息，请参见它们的手册页：tinderbox(1) 和 tbmaster(1)。

6.3. index.cgi 脚本

脚本从 main() 开始，首先验证是否在官方 Tinderbox 网站上运行。如果不是，则会显示一页提示，并给出官方网站的链接。

接着，它扫描日志目录，获取存在日志文件的配置项、分支和架构清单，避免在脚本中硬编码这些列表，造成空行或空列。该信息由日志文件名提取，文件名需匹配以下格式：

官方 Tinderbox 构建服务器使用的配置名称与其构建的分支一致。例如，releng_8 配置用于构建 RELENG_8 以及所有仍受支持的 8.x 发布分支。

完成启动过程后，会为每个配置调用 do_config()。

do_config() 会为单个 Tinderbox 配置生成 HTML 内容。

它先生成表头行，然后遍历指定配置下的每个分支构建，每个分支输出一行，流程如下：

对每个项目：
- 对该架构下的每台机器：
  - 若存在简略日志文件：
    调用 success() 判断构建是否成功。
    输出修改大小。
    输出简略日志文件大小并附带链接。
    如果存在完整日志文件：
    输出完整日志文件大小并附带链接。
  - 否则：
    不输出内容。

上述 success() 函数会扫描简略日志文件中是否含有 “tinderbox run completed” 字样，以判断构建是否成功。

配置和分支按其“分支等级”排序，排序规则如下：

HEAD 和 CURRENT 的等级为 9999。
RELENG_x 的等级为 *xx*99。
RELENG_x_y 的等级为 xxyy。

这意味着 HEAD 总是最高等级，RELENG 分支按数字升序排列，每个 STABLE 分支高于其派生的 release 分支。例如，FreeBSD 8 中的顺序为：

RELENG_8（等级 899）
RELENG_8_3（等级 803）
RELENG_8_2（等级 802）
RELENG_8_1（等级 801）
RELENG_8_0（等级 800）

Tinderbox 用 CSS 定义表格中每个单元格的颜色。构建成功显示绿色文字，构建失败显示红色文字。颜色会随时间推移逐渐变灰，每过半小时颜色就更趋向灰色。

6.4. 官方构建服务器

目前有三个构建服务器：

freebsd-current.sentex.ca 构建：

HEAD，适用于 amd64、arm、i386、i386/pc98、ia64、mips、powerpc、powerpc64 和 sparc64。
RELENG_9 以及受支持的 9.X 分支，适用于 amd64、arm、i386、i386/pc98、ia64、mips、powerpc、powerpc64 和 sparc64。

freebsd-stable.sentex.ca 构建：

RELENG_8 以及受支持的 8.X 分支，适用于 amd64、i386、i386/pc98、ia64、mips、powerpc 和 sparc64。

freebsd-legacy.sentex.ca 构建：

RELENG_7 以及受支持的 7.X 分支，适用于 amd64、i386、i386/pc98、ia64、powerpc 和 sparc64。

6.5. 官方摘要站点

Apache 被设置为使用 index.cgi 作为 DirectoryIndex。

第二部分：进程间通信

第 7 章套接字

7.1. 概述

BSD socket 将进程间通信提升到了一个新的层次。通信的进程不再必须运行在同一台机器上。它们可以运行在同一台机器上，但不再是必须的。

不仅如此，这些进程也不需要运行在相同的操作系统下。多亏了 BSD socket，你的 FreeBSD 软件可以顺利地与一台 Macintosh® 上运行的程序协作，与一台 Sun™ 工作站上的程序协作，甚至与一台运行 Windows® 2000 的程序协作，所有这些通过基于以太网的局域网连接在一起。

而你的软件同样可以与运行在另一栋楼、另一个大陆、甚至潜艇或航天飞机中的进程协作。

它也可以与不是计算机（至少不是严格意义上的计算机）中的进程协作，比如打印机、数码相机、医疗设备等设备中的进程。几乎任何能进行数字通信的东西。

7.2. 网络与多样性

我们已经暗示过网络的多样性。许多不同的系统必须彼此通信。而它们必须讲相同的语言。它们还必须以相同的方式理解这种语言。

人们常常以为肢体语言是通用的。但事实并非如此。在我十几岁的时候，我父亲带我去了保加利亚。我们在索非亚的一座公园里坐在一张桌边，一个小贩走近我们，试图卖我们一些烤杏仁。

那时我还没怎么学过保加利亚语，于是，我没有说“不”，而是左右摇头，这是“不”这个意思的“通用”肢体语言。结果小贩立刻开始给我们装杏仁。

这时我才记起有人告诉过我，在保加利亚，摇头表示“是”。我赶紧改为上下点头。小贩注意到了，拿起杏仁，离开了。对一个不知情的旁观者来说，我的肢体语言没有变化：我继续摇头点头。变的是肢体语言的含义。起初，小贩和我对相同的语言作出了完全不同的解释。我必须调整自己对这种语言的解释，才能让小贩理解。

计算机之间也是如此：相同的符号可能具有不同，甚至完全相反的含义。因此，两个计算机要能互相理解，不仅要使用相同的语言，还要以相同的方式解释这种语言。

7.3. 协议

尽管各种编程语言通常具有复杂的语法，并使用许多多字母的保留字（这使得它们对程序员更易于理解），数据通信的语言通常非常简洁。它们不使用多字节的单词，而是经常使用单个的比特。这样做有一个非常令人信服的理由：虽然数据在计算机内部的传输速度接近光速，但在两台计算机之间的传输速度往往要慢得多。

由于数据通信中使用的语言非常简洁，我们通常将其称为协议，而不是语言。

当数据从一台计算机传输到另一台计算机时，它总是使用多个协议。这些协议是分层的。数据可以比作洋葱的内部：你需要剥去几层“皮”才能获得数据。用一张图片来说明这一点会更好：

图 1. 协议层

在这个例子中，我们正在尝试从一个通过以太网连接的网页中获取一张图片。

图片由原始数据组成，原始数据只是一个 RGB 值的序列，我们的软件可以处理这些值，即将其转换为图像并显示在显示器上。

遗憾的是，我们的软件无法知道这些原始数据是如何组织的：它是 RGB 值的序列，还是灰度强度的序列，或者是 CMYK 编码的颜色？数据是用 8 位量表示，还是 16 位，或者是 4 位？图片由多少行和列组成？某些像素是否需要透明？

我想你已经明白了……

为了告诉我们的软件如何处理这些原始数据，它被编码为 PNG 文件。它也可以是 GIF 文件，或者 JPEG 文件，但它是 PNG。

而 PNG 就是一个协议。

在这个时候，我听到有些人喊道：“不，它不是！它是文件格式！”

当然，它是文件格式。但从数据通信的角度来看，文件格式就是协议：文件结构是一个语言，它简洁到极点，告诉我们的进程数据是如何组织的。因此，它是一个协议。

然而，如果我们收到的只是 PNG 文件，我们的软件将面临一个严重的问题：它怎么知道数据表示的是图像，而不是某些文本，或者是音频，或者其他什么？其次，怎么知道图像是 PNG 格式而不是 GIF、JPEG 或其他图像格式？

为了获得这些信息，我们使用了另一个协议：HTTP。这个协议可以准确地告诉我们，数据表示的是图像，并且它使用的是 PNG 协议。它还可以告诉我们其他信息，但我们现在还是集中在协议层次上。

所以，现在我们收到了一个包裹在 PNG 协议中的数据，再包裹在 HTTP 协议中。那我们是如何从服务器获得它的呢？

是通过 Ethernet 上的 TCP/IP 来的，实际上那是三个协议。为了更容易解释接下来的内容，我现在将重点讲解 Ethernet。

以太网是一个有趣的局域网（LAN）计算机连接系统。每台计算机都有一个网络接口卡（NIC），该卡具有一个唯一的 48 位 ID，称为地址。世界上没有两台 Ethernet NIC 拥有相同的地址。

这些 NIC 彼此连接。当一台计算机想要与同一 Ethernet LAN 中的另一台计算机通信时，它会通过网络发送消息。每个 NIC 都能看到这条消息。但作为以太网协议的一部分，数据中包含了目标 NIC 的地址（以及其他信息）。因此，只有其中一块网络接口卡会注意到这条消息，其他的都会忽略它。

但并不是所有的计算机都连接在同一个网络上。仅仅因为我们通过以太网接收到数据，并不意味着它来自我们自己的局域网。它可能来自其他通过 Internet 连接的网络（可能并非基于以太网的网络）。

所有数据通过互联网传输都使用 IP，即互联网协议。它的基本作用是告诉我们数据来自哪里，应该到达哪里。它不保证我们会收到数据，只是保证如果我们收到了数据，我们会知道它来自哪里。

即使我们收到了数据，IP 也不保证我们会按发送方发送的顺序接收到不同的数据块。例如，我们可能会先收到图像的中央部分，然后才收到左上角，或者右下角。

正是 TCP（传输控制协议）要求发送方重新发送任何丢失的数据，并将所有数据按正确的顺序排列。

总之，从一台计算机传输到另一台计算机，告诉它一张图像是什么样子的，竟然用了五个不同的协议。我们收到了包裹在 PNG 协议中的数据，再包裹在 HTTP 协议中，再包裹在 TCP 协议中，再包裹在 IP 协议中，最后包裹在以太网协议中。

哦，顺便说一句，可能还有许多其他协议参与了这个过程。例如，如果我们的局域网通过拨号连接到 Internet，那么它就用了 PPP 协议，通过调制解调器传输，调制解调器又使用了一个（或多个）不同的调制解调协议，等等，等等……

作为开发人员，你现在应该会问：“我该如何处理这一切？”

幸运的是，你并不需要处理所有这些内容。你需要处理其中的一部分，但不是全部。具体来说，你不必担心物理连接（在我们这个例子中是 Ethernet 和可能的 PPP 等）。你也不必处理互联网协议或传输控制协议。

换句话说，你不需要做任何事情来接收来自另一台计算机的数据。嗯，你确实需要请求它，但这几乎就像打开一个文件一样简单。

一旦你接收到数据，就由你来决定如何处理它。在我们的例子中，你需要理解 HTTP 协议和 PNG 文件结构。

举个比喻，所有的网络协议变成了一个灰色地带：这不仅仅是因为我们不理解它是如何工作的，而是因为我们不再关注它。套接字接口为我们处理了这一灰色地带：

图 2. 套接字覆盖的协议层

我们只需要理解任何告诉我们如何解释数据的协议，而不是如何从另一个进程接收数据，或如何发送数据到另一个进程。

7.4. 套接字模型

BSD 套接字是建立在基本 UNIX® 模型之上的：一切皆文件。在我们的例子中，套接字可以让我们接收一个HTTP 文件，可以这么说。然后，剩下的工作就是从中提取出PNG 文件。

由于互联网的复杂性，我们不能简单地使用 open 系统调用或 open() C 函数。相反，我们需要采取多个步骤来“打开”一个套接字。

然而，一旦我们完成这些步骤，我们就可以开始像处理任何文件描述符一样处理套接字：我们可以从中read、write、pipe，最后close它。

7.5. 必要的套接字函数

虽然 FreeBSD 提供了多种函数来操作套接字，但我们只需要四个来“打开”一个套接字。在某些情况下，我们甚至只需要两个。

7.5.1. 客户端与服务器的区别

通常，套接字数据通信的一端是服务器，另一端是客户端。

7.5.1.1. 共同的元素

7.5.1.1.1. socket

返回值与 open 相同，都是整数。FreeBSD 从与文件句柄相同的池中分配它的值。这使得套接字可以像文件一样被处理。

domain 参数告诉系统你希望使用的协议族。有许多协议族，其中一些是厂商特定的，其他的则是常见的。它们在 sys/socket.h 中声明。

对于 UDP、TCP 和其他 Internet 协议（IPv4），使用 PF_INET。

type 参数有五个定义的值，也在 sys/socket.h 中声明。所有这些值都以 “SOCK_” 开头。最常见的是 SOCK_STREAM，它告诉系统你请求一个可靠的流式传输服务（与 PF_INET 一起使用时是 TCP）。

如果你请求的是 SOCK_DGRAM，你将请求一个无连接的数据报传输服务（在我们的例子中是 UDP）。

如果你想控制底层协议（如 IP），甚至是网络接口（如以太网），你需要指定 SOCK_RAW。

最后，protocol 参数取决于前两个参数，并非总是有意义。在这种情况下，可以将其值设置为 0。

注意
未连接的套接字在 socket 函数中，我们并没有指定该套接字要连接到哪个其他系统。我们新创建的套接字仍然是未连接的。这是故意的：用电话的类比来说，我们刚刚将调制解调器接入电话线。我们既没有告诉调制解调器拨打电话，也没有告诉它在电话响起时接听。

7.5.1.1.2. sockaddr

各种套接字系列的函数期望得到（或使用 C 术语的指针）内存中一小块区域的地址。这些 C 声明在 sys/socket.h 中将其称为 struct sockaddr。这个结构在同一个文件中声明：

请注意 sa_data 字段的模糊性，它仅声明为 14 字节的数组，注释提示它可能包含超过 14 字节的数据。

这种模糊性是故意的。套接字是一个非常强大的接口。虽然大多数人可能认为它不过是一个 Internet 接口——并且大多数应用程序现在可能就是这样使用它——套接字几乎可以用于任何形式的进程间通信，其中互联网（或更确切地说是 IP）只是其中之一。

sys/socket.h 将套接字所处理的各种协议称为地址族，并在 sockaddr 定义之前列出它们：

用于 IP 的是 AF_INET，它是常量 2 的符号表示。

正是 sockaddr 中列出的 地址族 决定了如何使用 sa_data 字段中那些模糊命名的字节。

具体来说，当地址族为 AF_INET 时，我们可以在需要 sockaddr 的地方使用 netinet/in.h 中的 struct sockaddr_in：

我们可以通过以下方式可视化它的组织结构：

图 3. sockaddr_in 结构

三个重要的字段是 sin_family，它是结构的第 1 字节；sin_port，它是 16 位的值，存储在第 2 和第 3 字节中；以及 sin_addr，它是一个 32 位的 IP 地址整数表示，存储在第 4 至第 7 字节中。

现在，让我们尝试填充它。假设我们正在为 daytime 协议编写客户端，该协议简单地规定其服务器会将当前的日期和时间的文本字符串写入端口 13。我们希望使用 TCP/IP，因此我们需要在地址族字段中指定 AF_INET。AF_INET 被定义为 2。让我们使用 IP 地址 192.43.244.18，这是美国联邦政府的时间服务器（time.nist.gov）。

图 4. sockaddr_in 的具体示例

顺便提一下，sin_addr 字段被声明为 struct in_addr 类型，它在 netinet/in.h 中定义：

此外，in_addr_t 是一个 32 位的整数。

192.43.244.18 只是通过列出其所有 8 位字节（从最重要的字节开始）来表示一个 32 位整数的便捷表示法。

到目前为止，我们已经将 sockaddr 视为一种抽象。我们的计算机并不会将 short 整数存储为单一的 16 位实体，而是作为一系列的 2 个字节。类似地，它将 32 位整数存储为一系列 4 个字节。

假设我们编写了如下代码：

结果会是什么样子呢？

当然，这取决于具体的计算机系统。在一个奔腾或其他 x86 系统上，它会像这样显示：

图 5. 在 Intel 系统上的 sockaddr_in

在不同的系统上，可能会是这样的：

图 6. 在 MSB 系统上的 sockaddr_in

在 PDP 上，它的表现可能又会不同。但上述两种方式是如今最常见的两种实现方式。

通常，为了编写可移植的代码，程序员会假装这些差异并不存在。而他们确实也能蒙混过关（除非他们在写汇编语言）。不过，当你在为 sockets 编程时，你就不能这么轻松地蒙混过关了。

为什么？

因为在与另一台计算机通信时，你通常不知道它是以 最高有效字节（MSB）优先还是 最低有效字节（LSB）优先来存储数据的。

你可能会想，“那 sockets 难道不会替我处理这些吗？”

不会。

这个答案可能一开始让你感到惊讶，但请记住，通用的 sockets 接口只理解 sockaddr 结构中的 sa_len 和 sa_family 字段。你不必担心这些字段的字节序（当然，在 FreeBSD 上 sa_family 反正只有 1 个字节，但许多其他 UNIX® 系统没有 sa_len 字段，并且使用 2 字节的 sa_family 字段，并且期望数据以该计算机的本地顺序存储）。

但对 sockets 而言，其余的数据就只是 sa_data[14]。根据 地址族 的不同，sockets 只是将这些数据转发到目标地。

事实上，当我们输入一个端口号时，是为了让另一台计算机知道我们请求的是什么服务。而当我们是服务器时，我们读取端口号，是为了知道对方期望我们提供什么服务。无论是哪种情况，sockets 只是将端口号当作数据转发。它不会对其进行任何解释。

同样，我们输入 IP 地址，是为了告诉网络上的所有中间设备数据应该被送往何处。sockets 依旧只是将其当作数据转发。

这就是为什么，我们（程序员，而不是 sockets）必须区分我们的计算机使用的字节序与用于发送给另一台计算机的标准字节序。

我们称我们的计算机使用的字节序为 主机字节序，简称 主机序。

而在 IP 上传送多字节数据有一个约定，就是以 MSB 优先 的方式传送。我们称这种顺序为 网络字节序，简称 网络序。

现在，如果我们将上面的代码编译为运行在 Intel 架构的计算机上，我们的 主机字节序 将会产生如下结果：

图 7. Intel 系统上的主机字节序

但 网络字节序 要求我们以 MSB 优先的方式存储数据：

图 8. 网络字节序

不幸的是，我们的 主机序 与 网络序 完全相反。

我们有几种方式可以应对这种情况。其中一种方法是在代码中反转这些值：

这样可以“骗过”我们的编译器，让它以 网络字节序 存储这些数据。在某些情况下，这确实是正确的做法（比如当你在写汇编语言的时候）。但在大多数情况下，这会引起问题。

假设你用 C 写了一个基于 sockets 的程序。你知道它会运行在奔腾上，于是你将所有常量反转后强行设为 网络字节序。一切正常。

直到有一天，你信赖的旧奔腾变成了锈迹斑斑的老古董。你换了一台新机器，它的 主机序 正好和 网络序 一致。你重新编译了你的所有软件。所有程序都运作良好，除了你那一个程序。

你已经忘了当初你曾经强行把所有常量写成了和 主机序 相反的顺序。你开始拔头发，呼唤你听过和没听过的所有神的名字，用海绵棒猛击显示器，进行各种传统的“调试祭祀仪式”，试图搞清楚为什么一个一直工作良好的程序突然就失效了。

最终，你搞清楚了问题的根源，骂了几句脏话，然后开始重写你的代码。

在 MSB 优先 的系统上，这些函数不会进行任何操作。而在 LSB 优先 的系统上，它们会将值转换为正确的顺序。

所以，无论你的软件是在哪个系统上编译的，只要使用这些函数，你的数据最终就会以正确的顺序被传送出去。

7.5.1.2. 客户端函数

通常，客户端负责发起与服务器的连接。客户端知道它要联系哪个服务器：它知道服务器的 IP 地址，也知道服务器所监听的端口。这就像你拿起电话拨号（这个地址），然后在有人接听后请求找负责“wingdings”的人（这个端口）。

7.5.1.2.1. connect

参数 s 是 socket，也就是 socket 函数返回的值。name 是一个指向 sockaddr 的指针，我们前面已经详细讨论过该结构。最后，namelen 用于告知系统我们的 sockaddr 结构体的字节数。

如果 connect 调用成功，它会返回 0。否则返回 -1，并将错误代码存储在 errno 中。

connect 可能失败的原因有很多。例如，在尝试连接到某个互联网地址时，对方的 IP 地址可能根本不存在，或者对方主机宕机了，或者太忙，或者根本没有在指定端口监听任何服务。也有可能直接拒绝来自特定代码的任何请求。

7.5.1.2.2. 我们的第一个客户端

现在我们已经掌握足够知识，来编写一个非常简单的客户端程序，它将从 192.43.244.18 获取当前时间并打印到 stdout。

现在请打开编辑器，输入上述内容，保存为 daytime.c，然后编译并运行它：

在本例中，日期是 2001 年 6 月 19 日，时间是 UTC 时间 02:29:25。当然，你运行程序时的输出会有所不同。

7.5.1.3. 服务器函数

典型的服务器不会主动发起连接。它会等待客户端来调用它、请求服务。它不知道客户端什么时候会来，也不知道会有多少客户端会来。有时候它只是静静地坐在那里等待，而下一刻，可能就会突然被大量同时请求的客户端淹没。

sockets 接口提供了三个基本函数来处理这一情况。

7.5.1.3.1. bind

端口就像电话线路上的分机：拨通一个号码后，还需要拨分机号才能联系到特定的人或部门。

除了在 addr 中指定端口，服务器也可以包括它自己的 IP 地址。然而，它也可以使用符号常量 INADDR_ANY 来表示将接收发往该端口的所有请求，而不管目标 IP 是什么。这个符号常量和其他几个类似常量都定义在 netinet/in.h 中：

假设我们要写一个基于 TCP/IP 的 daytime 协议服务器。回忆一下，它使用端口 13。我们的 sockaddr_in 结构将如下所示：

图 9. 示例服务器 sockaddr_in

7.5.1.3.2. listen

继续我们之前的电话比喻：当你告诉总机你在哪个分机接电话后，你就走进办公室，确保电话插好了，铃声打开了。此外，你还要确保电话支持“通话中等待”，以便即使你正在通话中也能听到新的来电。

这里的 backlog 参数告诉 sockets：在你还在处理上一个请求时，最多可以接受多少个挂起的请求。换句话说，它决定了待处理连接队列的最大长度。

7.5.1.3.3. accept

电话铃响之后，你接起电话，就建立了与客户端的连接。该连接会一直保持，直到你或客户端挂断为止。

注意这次 addrlen 是一个指针。这是因为在这个调用中由 socket 来填写 addr，也就是 sockaddr_in 结构。

返回值是一个整数。实际上，accept 返回的是一个 新 socket。你将使用这个新 socket 来与客户端通信。

那旧的 socket 呢？它仍然监听更多的请求（还记得我们传给 listen 的 backlog 吗？），直到我们调用 close。

而新的 socket 仅用于通信。它是完全连接的，不能再传给 listen 去接受其他连接。

7.5.1.3.4. 我们的第一个服务器

我们的第一个服务器比我们的第一个客户端要复杂一些：不仅使用了更多的 sockets 函数，而且我们需要将它写成一个守护进程（daemon）。

最好的方式是，在绑定端口之后创建一个 子进程。主进程随即退出，将控制权还给 shell（或调用它的其他程序）。

子进程调用 listen，然后进入一个无限循环，接受连接、提供服务、最终关闭该连接的 socket。

我们首先创建一个 socket。然后填写 sa 中的 sockaddr_in 结构体。注意对 INADDR_ANY 的条件使用：

其值为 0。由于我们刚刚对整个结构体使用了 bzero，再次将其设为 0 是多余的。但如果我们将代码移植到某个 INADDR_ANY 也许不是零的系统上，就必须显式地将它赋值给 sa.sin_addr.s_addr。多数现代 C 编译器足够聪明，它们会发现 INADDR_ANY 是一个常量，只要它的值是零，就会自动优化掉整个条件语句。

成功调用 bind 之后，我们就准备好变成一个 守护进程（daemon）：我们使用 fork 创建一个子进程。在父进程和子进程中，变量 s 都是我们的 socket。父进程不再需要它，于是它调用 close，然后返回 0，告知其父进程它已经成功终止。

与此同时，子进程继续在后台运行。它调用 listen，将 backlog 设置为 4。这个值不需要太大，因为 daytime 并不是一个有很多客户端频繁请求的协议，而且每个请求也能被瞬间处理完毕。

最后，守护进程启动一个无限循环，按以下步骤操作：

调用 accept。它会阻塞，直到有客户端连接。此时，它会获得一个新的 socket c，用于与这个特定客户端通信。
使用 C 函数 fdopen 将 socket 从底层 文件描述符 转换为 C 风格的 FILE 指针，这样可以后续使用 fprintf。
获取当前时间，并用 ISO 8601 格式打印到 client “文件”中。随后使用 fclose 关闭该文件，这也会自动关闭对应的 socket。

我们可以将这个模式泛化，作为许多其他服务器的模板：

图 10. 顺序服务器（Sequential Server）

这个流程图适用于 顺序服务器，即一次只能服务一个客户端的服务器，就像我们的 daytime 服务器一样。只有在客户端和服务器之间没有真正的“对话”时，这种方式才是可行的：一旦服务器检测到客户端连接，它便立即发送一些数据，然后关闭连接。整个过程可能只需几纳秒便完成。

这种流程图的优点在于，除了 fork 之后父进程退出之前那一瞬间，始终只有一个进程活跃：服务器不会占用太多内存和系统资源。

注意，我们在流程图中添加了 初始化守护进程 的步骤。虽然我们的例子中不需要初始化守护进程，但这是在程序流程中设置 signal 信号处理器、打开可能用到的文件等的良好位置。

几乎流程图中所有内容都可以原样用于许多不同的服务器中，唯独 serve 部分是个例外。我们可以把它当作一个 “黑箱”，即根据自己的服务器需求特别设计的部分，然后“插入”到其余部分中即可。

并非所有协议都如此简单。很多协议都需要从客户端接收请求、回复请求，然后再次接收同一客户端的新请求。因此，它们无法预先知道需要服务多长时间。这类服务器通常会为每个客户端创建一个新进程。在新进程服务其客户端的同时，守护进程仍可继续监听新的连接。

现在，请将上述源代码保存为 daytimed.c（按照惯例，守护进程的程序名以字母 d 结尾）。编译后尝试运行它：

发生了什么？如你所知，daytime 协议使用的是端口 13。但所有小于 1024 的端口都是保留给超级用户的（否则任何人都可以伪装成一个守护进程，服务一个常见端口，从而造成安全漏洞）。

这次以超级用户身份再试一次：

什么…… 没有任何输出？我们再试一次：

每个端口在同一时间只能被一个程序绑定。我们的第一次尝试实际上是成功的：它启动了子守护进程并静默返回。它仍在后台运行，并将一直运行，直到你终止它、它的系统调用失败，或者你重启系统。

很好，我们知道它在后台运行。但它真的工作吗？怎么知道它是一个正确的 daytime 服务器？很简单：

telnet 先尝试使用新的 IPv6，失败后改用 IPv4 并成功连接。守护进程正常运行。

如果你能通过 telnet 访问另一台 UNIX® 系统，也可以用它来远程测试服务器。我所用的计算机没有静态 IP 地址，因此我做了如下测试：

它确实工作了。那么用域名也行吗？

顺便说一句，telnet 在我们的守护进程关闭 socket 后打印 Connection closed by foreign host 消息，这证明我们代码中使用 fclose(client); 的做法确实起到了作用。

7.6. 辅助函数

FreeBSD 的 C 标准库包含许多用于 socket 编程的辅助函数。例如，在我们的示例客户端中，我们是将 time.nist.gov 的 IP 地址硬编码进程序的。但我们并不总是知道 IP 地址。即使知道，如果程序允许用户输入 IP 地址，甚至是域名，它也会更灵活。

7.6.1. `gethostbyname`

这两个函数都会返回一个指向 hostent 结构体的指针，该结构体中包含大量关于该域名的信息。对我们的用途来说，该结构体中的 h_addr_list[0] 字段指向正确地址的 h_length 字节，这些字节已经是 网络字节序。

这使得我们可以创建一个更加灵活——也更加实用——的 daytime 程序版本：

现在我们可以在命令行中输入域名（或 IP 地址，二者皆可），程序就会尝试连接该地址的 daytime 服务器。否则，它仍然会默认连接 time.nist.gov。不过即便是这种情况，我们也使用了 gethostbyname，而不是硬编码 192.43.244.18。这样一来，即使它将来更换了 IP 地址，我们依然可以找到它。

由于从本地服务器获取时间几乎不花什么时间，你可以连续运行两次 daytime：第一次从 time.nist.gov 获取时间，第二次从你自己的系统中获取。然后你就可以比较两者的结果，看看你的系统时钟有多精确：

如你所见，我的系统时间比 NIST 时间快了两秒。

7.6.2. `getservbyname`

servent 结构体包含 s_port 字段，其中保存了正确的端口号，且已经是 网络字节序。

如果我们事先不知道 daytime 服务使用的端口，可以这样获取：

通常你是知道端口号的。但如果你正在开发一个新的协议，可能会在一个非官方端口上测试它。某一天，你会为该协议和它的端口注册编号（哪怕只是写进你的 /etc/services 文件中，getservbyname 正是查这个文件）。在上述代码中你也可以不返回错误，而是临时指定一个端口号。一旦你将协议列入 /etc/services，你的软件就能自动找到对应端口，而无需重写代码。

7.7. 并发服务器

与顺序服务器不同，并发服务器 必须能够同时为多个客户端提供服务。例如，一个 聊天服务器 可能会为某个特定客户端服务几个小时——它不能等这个客户端断开了，才去服务下一个客户端。

这就要求我们对流程图进行重大改动：

图 11. 并发服务器

我们将 服务逻辑 从 守护进程 中移到了独立的 服务进程 中。但由于每个子进程会继承所有已打开的文件（socket 被视为一种文件），新进程不仅会继承由 accept 返回的 连接句柄，也会继承由顶层进程最初创建的 监听 socket。

但 服务进程 并不需要这个监听 socket，因此应立即对它执行 close 操作。同样地，守护进程 也不再需要连接 socket，不仅应当关闭它，而且必须关闭——否则迟早会耗尽可用的 文件描述符。

当 服务进程 完成服务后，它应关闭连接 socket。此时不再返回 accept，而是直接退出。

在 UNIX® 中，进程实际上并不会真正退出，而是会返回给它的父进程。通常父进程会调用 wait 来等待其子进程，并获取其返回值。但我们的 守护进程 不能就此停止并等待子进程完成。否则就违背了创建多个子进程的初衷。但如果它永远不调用 wait，子进程就会变成 *僵尸进程（zombie）*——虽然不再起作用，但仍残留在系统中。

因此，守护进程 需要在 初始化阶段 设置 信号处理器。至少要处理 SIGCHLD 信号，以便清除子进程的返回值，并释放它们占用的系统资源。

这也正是为什么流程图中多了一个不连接任何其他模块的 处理信号 方框。顺便说一句，许多服务器还会处理 SIGHUP 信号，并通常将其解释为超级用户发出的“重新读取配置文件”的信号。这样我们就可以更改设置，而不必杀掉并重启这些服务器。

第三部分内核

第四部分架构

第五部分附录

参考文献

[1] Dave A Patterson and John L Hennessy. Copyright® 1998 Morgan Kaufmann Publishers, Inc. 1-55860-428-6. Morgan Kaufmann Publishers, Inc. Computer Organization and Design. The Hardware / Software Interface. 1-2.

[2] W. Richard Stevens. Copyright® 1993 Addison Wesley Longman, Inc. 0-201-56317-7. Addison Wesley Longman, Inc. Advanced Programming in the Unix Environment. 1-2.

[3] Marshall Kirk McKusick and George Neville-Neil. Copyright® 2004 Addison-Wesley. 0-201-70245-2. Addison-Wesley. The Design and Implementation of the FreeBSD Operating System. 1-2.

[4] Aleph One. Phrack 49; "Smashing the Stack for Fun and Profit".

[5] Chrispin Cowan, Calton Pu, and Dave Maier. StackGuard; Automatic Adaptive Detection and Prevention of Buffer-Overflow Attacks.

[6] Todd Miller and Theo de Raadt. strlcpy and strlcat — consistent, safe string copy and concatenation.

第 2 章编程工具

2.1. 概要

2.2. 引言

FreeBSD 提供了一个优秀的开发环境。C 和 C++ 编译器以及汇编器随基本系统一同提供，更不用说像 sed 和 awk 这样的经典 UNIX® 工具了。如果这还不够，Ports 中还有许多其他编译器和解释器可供选择。下一节列出了一些可用的选项。FreeBSD 与 POSIX®、ANSI C 等标准以及自身的 BSD 传统高度兼容，因此你可以编写在多种平台上几乎无需修改即可编译和运行的应用程序。

大多数内容几乎不需要任何编程知识，尽管它假设你对 UNIX® 的基本操作已有一定掌握，并且愿意学习！

2.3. 编程简介

2.3.1. 解释器

2.3.2. FreeBSD 提供的解释器

下面是一些可以通过 FreeBSD Ports 获取的解释器列表，并简要介绍了一些较为流行的解释型语言。

关于如何获取和安装 Ports 中的应用程序，可以参考手册中的。

Bywater Basic 解释器可以在 FreeBSD 的 Port 中找到，位置是，Phil Cockroft 编写的 Basic 解释器（原名 Rabbit Basic）则位于。

Lisp 是一种极其强大而复杂的语言，但可能显得庞大且不易掌握。

在 FreeBSD 的 Port 中提供了多种可在 UNIX® 系统上运行的 Lisp 实现。Bruno Haible 和 Michael Stoll 编写的 CLISP 可在找到；一个更为简化的 Lisp 实现 SLisp 可在找到。

Perl Perl 在系统管理员中非常流行，用于编写脚本；它也常用于 Web 服务器上编写 CGI 脚本。

Perl 可在 FreeBSD 的 Port 中找到，位置是，适用于所有 FreeBSD 发行版。

可在 Port 中的找到 Elk Scheme 解释器；MIT Scheme 解释器位于，SCM Scheme 解释器则位于。

Lua Lua 是一种轻量级的可嵌入脚本语言。它具有良好的可移植性，结构也相对简单。Lua 可在 Port 中通过获取。它也被包含在 base 系统中，路径为 /usr/libexec/flua，用于 base 系统组件。第三方软件不应依赖 flua。

可在 Port 中通过获取Python 的最新版本。

Ruby Ruby 是一种解释型的纯面向对象编程语言。它因其易于理解的语法、编写灵活性强以及便于开发与维护大型复杂程序而广受欢迎。

可在 Port 中通过获取 Ruby。

多个版本的 Tcl 可作为 FreeBSD 的 Port 提供。最新版本 Tcl 8.7 可在找到。

2.3.3. 编译器

编译器与解释器有很大不同。首先，你需要使用编辑器在文件中编写代码（一个或多个文件）。然后运行编译器，看看它是否接受你的程序。如果没有编译成功，咬紧牙关，返回编辑器进行修改；如果编译成功并生成了程序，你可以在 shell 命令提示符下运行它，或者在调试器中运行，以查看它是否正常工作。^[]^

由于使用单独程序进行编辑-编译-运行-调试的周期相当繁琐，许多商业编译器制造商已经开发了集成开发环境（简称 IDE）。FreeBSD 的基础系统中不包括 IDE，但在 Ports Collection 中可以找到，许多人也使用 Emacs 来实现这个目的。关于如何使用 Emacs 作为 IDE，请参见。

2.4. 使用 `cc` 编译

本节介绍了 FreeBSD 基础系统中安装的 clang 编译器用于 C 和 C++ 的情况。Clang 被安装为 cc；GNU 编译器在 Ports Collection 中也可以找到。使用解释器生成程序的详细过程因解释器而异，通常在解释器的文档和在线帮助中有很好的介绍。

一旦你编写完你的杰作，下一步就是将它转换成能够（希望！）在 FreeBSD 上运行的形式。这通常涉及几个步骤，每个步骤都由一个独立的程序完成。

预处理你的源代码，移除注释并进行其他操作，如在 C 中展开宏。
检查你的代码的语法，查看你是否遵循了语言的规则。如果没有，它会报错！
将源代码转换为汇编语言——这非常接近机器代码，但仍然可以被人理解。据说。
将汇编语言转换为机器代码——是的，我们在谈论的是比特和字节，1 和 0。
检查你是否以一致的方式使用了诸如函数和全局变量之类的东西。例如，如果你调用了一个不存在的函数，它会报错。
如果你试图从多个源代码文件生成可执行文件，计算如何将它们组合在一起。
计算如何生成一个系统的运行时加载器能够加载到内存并运行的程序。
最后，将可执行文件写入文件系统。

“编译”一词通常仅指步骤 1 到 4，其余步骤被称为链接。有时步骤 1 被称为 预处理，步骤 3-4 被称为汇编。

幸运的是，几乎所有的细节都被隐藏了，因为 cc 是一个前端，它为你管理调用所有这些程序并传递正确的参数；只需输入

% cc foobar.c

就会将 foobar.c 按照上述步骤进行编译。如果你有多个文件需要编译，只需像这样操作：

% cc foo.c bar.c

请注意，语法检查只是检查语法。它不会检查你可能犯的任何逻辑错误，比如将程序写入死循环，或者使用了冒泡排序而你本该使用二分排序。^[]^

cc 有很多选项，都可以在手册页中找到。以下是一些最重要的选项，并附有如何使用它们的示例。

-o filename 指定输出文件的名称。如果不使用此选项，cc 将生成一个名为 a.out 的可执行文件。^[]^

% cc foobar.c               可执行文件是 a.out
% cc -o foobar foobar.c     可执行文件是 foobar

-c 仅编译文件，不进行链接。对于只想检查语法的简单程序，或使用 Makefile 的情况非常有用。

% cc -c foobar.c

这将生成一个名为 foobar.o 的 目标文件（而不是可执行文件）。可以将该目标文件与其他目标文件一起链接，生成可执行文件。

% cc -g foobar.c

这将生成程序的调试版本。^[]^

% cc -O -o foobar foobar.c

这将生成优化版的 foobar。

以下三个标志会强制 cc 检查你的代码是否符合相关的国际标准，通常称为 ANSI 标准，严格来说是 ISO 标准。

-Wall 启用 cc 作者认为值得启用的所有警告。尽管名称为 “Wall”，但它并不会启用 cc 能够生成的所有警告。

-ansi 关闭 cc 提供的大多数非 ANSI C 特性。尽管名称为 “ansi”，但它并不能严格保证你的代码符合标准。

-pedantic 关闭 cc 的所有非 ANSI C 特性。

通常，你应该尽量使代码具有可移植性，否则你可能需要在以后完全重写程序，以便它能够在其他地方工作——谁知道你几年后会使用什么呢？

% cc -Wall -ansi -pedantic -o foobar foobar.c

这将在检查 foobar.c 是否符合标准后生成一个名为 foobar 的可执行文件。

-l <library> 指定在链接时使用的函数库。

% cc -o foobar foobar.c -lm

这将把数学库的函数链接到 foobar 中。

如果你正在编译 C++ 代码，使用 c++。在 FreeBSD 上，c++ 也可以通过 clang++ 调用。

% c++ -o foobar foobar.cc

这将从 C++ 源文件 foobar.cc 生成一个可执行文件 foobar。

2.4.1. 常见的 `cc` 查询和问题

2.4.1.1. 我编译了一个名为 foobar.c 的文件，但找不到名为 foobar 的可执行文件。它去了哪里？

记住，除非你特别告诉它，否则 cc 会将可执行文件命名为 a.out。使用 -o <filename> 选项：

% cc -o foobar foobar.c

2.4.1.2. 好的，我有一个名为 foobar 的可执行文件，在运行 `ls` 时能看到它，但当我在命令行中输入 foobar 时，告诉我没有这样的文件。为什么它找不到？

2.4.2. 我叫我的可执行文件为 test，但运行时什么也没发生。怎么回事？

大多数 UNIX® 系统都有一个名为 test 的程序，它位于 /usr/bin 目录，Shell 在检查当前目录之前会先找到它。你可以输入：

% ./test

或者给你的程序取个更好的名字！

2.4.2.1. 我编译了程序，刚开始似乎运行得很好，然后出现了一个错误，说什么“core dumped”。那是什么意思？

2.4.2.2. 很有意思，但我现在该做什么？

使用调试器分析 core 文件（请参见）。

2.4.2.3. 当我的程序发生 core dump 时，它提到一个“segmentation fault”。那是什么意思？

这基本上意味着你的程序尝试对内存执行某种非法操作；UNIX® 设计的目的是保护操作系统和其他程序免受恶意程序的影响。

常见的原因包括：

尝试写入 NULL 指针，例如：
```
char *foo = NULL;
strcpy(foo, "bang!");
```
使用未初始化的指针，例如：
```
char *foo;
strcpy(foo, "bang!");
```
指针将具有一些随机值，运气好的话，它会指向一个程序无法访问的内存区域，内核会在程序产生任何损害之前终止它。如果运气不好，它可能会指向你程序内部的某个地方，破坏你的数据结构，导致程序神秘地失败。
尝试访问数组末尾之外的元素，例如：
```
int bar[20];
bar[27] = 6;
```
尝试存储到只读内存中，例如：
```
char *foo = "My string";
strcpy(foo, "bang!");
```
UNIX® 编译器通常会将类似 "My string" 的字符串字面量放入只读内存区域。

对 malloc() 和 free() 做不当操作，例如：

char bar[80];
free(bar);

或者

char *foo = malloc(27);
free(foo);
free(foo);

2.4.2.4. 有时当我得到一个 core dump 时，它说是 bus error。我在 UNIX® 书上看到说这意味着硬件问题，但电脑似乎还在工作。这是真的吗？

不，幸运的是不是（当然，除非你真的遇到了硬件问题…）。这通常是指你以不应有的方式访问了内存。

2.4.2.5. 这个 core dump 的过程看起来很有用，如果我能在需要时使其发生就好了。我可以这样做吗，还是只能等到出错？

是的，你可以这样做，只需去另一个控制台或 xterm，执行

% ps

找出你的程序的进程 ID，然后执行

% kill -ABRT pid

其中 <pid> 是你查找的进程 ID。

如果你的程序陷入了死循环，这会很有用。如果程序捕获了 SIGABRT 信号，还有其他一些信号也有类似的效果。

另外，你还可以通过调用 abort() 函数，在程序内部创建 core dump。有关更多信息，请参阅的手册页。

如果你想从程序外部创建 core dump，但又不希望程序终止，可以使用 gcore 程序。有关更多信息，请参阅的手册页。

2.5. Make

2.5.1. 什么是 `make`？

当你在处理一个简单的程序，只有一两个源文件时，输入

% cc file1.c file2.c

还算可以，但当有多个文件时，输入命令会变得非常繁琐——而且编译可能也会花费很长时间。

解决这个问题的一种方法是使用目标文件，并且只有在源代码发生变化时才重新编译源文件。所以我们可能会像这样：

% cc file1.o file2.o … file37.c …

如果我们只修改了 file37.c，而其他文件没有变化，则可以这样做。这样可以加快编译速度，但依然不能解决输入命令的问题。

或者我们可以写一个 shell 脚本来解决输入命令的问题，但它会重新编译所有文件，这在大型项目中非常低效。

如果我们有数百个源文件散布在不同地方呢？如果我们在一个团队中工作，而其他人没有告诉我们他们修改了我们使用的某个源文件怎么办？

2.5.2. 使用 `make` 的示例

这是一个非常简单的 makefile：

foo: foo.c
	cc -o foo foo.c

它由两行组成，一行是依赖关系行，另一行是创建行。

makefile 的另一个有用特点是，目标不一定非得是程序。例如，我们可以有一个像这样的 makefile：

foo: foo.c
	cc -o foo foo.c

install:
	cp foo /home/me

我们可以通过输入以下命令告诉 make 我们想要创建哪个目标：

% make target

make 会只查看该目标并忽略其他目标。例如，如果我们输入 make foo，make 会忽略 install 目标。

2.5.3. `make` 和包含文件

C 代码通常以一系列要包含的文件开始，例如 stdio.h。其中一些是系统包含文件，有些则是当前项目中的文件：

#include <stdio.h>
#include "foo.h"

int main(....

为了确保一旦 foo.h 被修改，这个文件会立刻重新编译，你需要在 Makefile 中添加它：

foo: foo.c foo.h

如果你在 Makefile 中添加以下内容：

depend:
	cc -E -MM *.c > .depend

并运行 make depend，那么会生成一个 .depend 文件，内容包含对象文件、C 文件和包含文件的依赖关系：

foo.o: foo.c foo.h

如果你修改了 foo.h，下次运行 make 时，所有依赖于 foo.h 的文件都会重新编译。

每次添加包含文件时，别忘了运行 make depend。

2.5.4. FreeBSD Makefile

MASTER_SITES=   ftp://freefall.cdrom.com/pub/FreeBSD/LOCAL_PORTS/
DISTFILES=      scheme-microcode+dist-7.3-freebsd.tgz

.include <bsd.port.mk>

现在，如果我们进入该端口的目录并输入 make，会发生以下几件事：

系统检查此端口的源代码是否已经存在。
如果不存在，将建立与 MASTER_SITES 中指定的 URL 的 FTP 连接来下载源代码。
系统计算源代码的校验和，并与已知的源代码校验和进行比较，确保源代码在传输过程中没有损坏。
应用所需的任何更改，使源代码能够在 FreeBSD 上正常工作——这称为 patching。
进行源代码所需的特殊配置。（许多 UNIX® 程序在编译时会试图找出它们运行的 UNIX® 版本和所支持的 UNIX® 特性——在 FreeBSD 的 ports 系统中，这些信息会被提供给源代码。）
编译程序的源代码。实际上，我们进入源代码解压的目录并执行 make——程序自己的 makefile 已包含构建程序所需的信息。
我们现在得到了编译好的程序。如果需要，可以进行测试；当我们确认程序正常工作时，可以输入 make install，这会将程序和任何需要的支持文件复制到正确的位置，并在 package database 中创建条目，以便以后如果改变主意，可以轻松卸载该端口。

现在你应该会同意，这个四行的脚本非常强大！

2.5.5. `make` 的高级用法

make 是一个非常强大的工具，能做的事情远远超过上面简单示例所展示的内容。不幸的是，存在多种不同版本的 make，它们之间有很大差异。学习它们能做什么的最佳方式可能是阅读文档——希望本介绍已经为你提供了一个良好的基础。可以通过手册页，了解更多关于变量、参数及如何使用 make 的全面讨论。

要查看 GNU make 的 info 页面，你需要编辑 /usr/local/info 目录下的 dir 文件，添加一行：

* Make: (make).                 The GNU Make utility.

添加后，你可以输入 info 并从菜单中选择 make（或者在 Emacs 中，使用 C-h i）。

2.6. 调试

2.6.1. 可用调试器简介

本节旨在提供使用调试器的简要介绍，不涵盖诸如内核调试等专业话题。有关详细信息，请参阅。

FreeBSD 提供的标准调试器是 lldb（LLVM 调试器）。由于它是该版本的标准安装的一部分，因此无需做任何特殊的操作即可使用它。它提供了很好的命令帮助，可以通过 help 命令访问，还有。

注意
也可以通过从获取 lldb 命令。

FreeBSD 还提供了另一个调试器 gdb（GNU 调试器）。与 lldb 不同，gdb 并不是 FreeBSD 的默认安装，若要使用它，请从 Ports 或 Packages 中安装。它提供了很好的在线帮助和一套 info 页面。

2.6.2. 使用 lldb

2.6.2.1. 启动 lldb

通过输入以下命令启动 lldb：

% lldb -- progname

2.6.2.2. 使用 lldb 运行程序

Breakpoint 1: where = temp`main, address = …

（没有源代码文件名和行号的指示）表示程序没有使用 -g 编译。

注意
大多数 lldb 命令都有可以替代的简短形式，这里使用了较长的形式以便更清晰。

以下是如何使用 lldb 查找程序错误的一个简单示例。我们有一个故意出错的程序：

#include <stdio.h>

int bazz(int anint);

main() {
	int i;

	printf("This is my program\n");
	bazz(i);
	return 0;
}

int bazz(int anint) {
	printf("You gave me %d\n", anint);
	return anint;
}

此程序将 i 设置为 5 并将其传递给函数 bazz()，然后打印出我们给它的数字。

编译并运行该程序将显示：

% cc -g -o temp temp.c
% ./temp
This is my program
anint = -5360

这不是预期的结果！该是时候看看发生了什么了！

% lldb -- temp
(lldb) target create "temp"
Current executable set to 'temp' (x86_64).
(lldb) breakpoint set -n main				跳过设置代码
Breakpoint 1: where = temp`main + 15 at temp.c:8:2, address = 0x00000000002012ef	lldb 设置断点在 main()
(lldb) process launch					运行到 main()
Process 9992 launching
Process 9992 launched: '/home/pauamma/tmp/temp' (x86_64)	程序开始运行

Process 9992 stopped
* thread #1, name = 'temp', stop reason = breakpoint 1.1	lldb 停在 main()
    frame #0: 0x00000000002012ef temp`main at temp.c:8:2
   5	main() {
   6		int i;
   7
-> 8		printf("This is my program\n");			指示停在的行
   9		bazz(i);
   10		return 0;
   11	}
(lldb) thread step-over			执行到下一行
This is my program						程序打印输出
Process 9992 stopped
* thread #1, name = 'temp', stop reason = step over
    frame #0: 0x0000000000201300 temp`main at temp.c:9:7
   6		int i;
   7
   8		printf("This is my program\n");
-> 9		bazz(i);
   10		return 0;
   11	}
   12
(lldb) thread step-in			进入 bazz()
Process 9992 stopped
* thread #1, name = 'temp', stop reason = step in
    frame #0: 0x000000000020132b temp`bazz(anint=-5360) at temp.c:14:29	lldb 显示堆栈帧
   11	}
   12
   13	int bazz(int anint) {
-> 14		printf("You gave me %d\n", anint);
   15		return anint;
   16	}
(lldb)

等一下！anint 怎么变成了 -5360？它不是在 main() 中被设置为 5 吗？让我们回到 main() 看看。

(lldb) up		返回到调用栈
frame #1: 0x000000000020130b temp`main at temp.c:9:2		lldb 显示堆栈帧
   6		int i;
   7
   8		printf("This is my program\n");
-> 9		bazz(i);
   10		return 0;
   11	}
   12
(lldb) frame variable i			显示 i 的值
(int) i = -5360							lldb 显示 -5360

哦，糟糕！看看代码，我们忘记初始化 i 了。我们本应写成：

...
main() {
	int i;

	i = 5;
	printf("This is my program\n");
...

但我们忘记了 i=5; 这一行。由于没有初始化 i，它就有了程序运行时该内存位置上的任意值，在这种情况下是 -5360。

技巧
每次我们进入或退出一个函数时，lldb 命令都会显示堆栈帧，即使我们使用 up 和 down 移动调用栈时也是如此。这会显示函数的名称和其参数的值，帮助我们跟踪程序的运行情况。（调用栈是程序存储传递给函数的参数和返回时要跳转的位置的存储区域。）

2.6.2.3. 使用 lldb 检查核心文件

要检查核心文件，需要在指定程序的同时指定核心文件的名称。不要像通常那样启动 lldb，而是输入 lldb -c <progname>.core -- <progname>。

调试器将显示如下内容：

% lldb -c progname.core -- progname
(lldb) target create "progname" --core "progname.core"
Core file '/home/pauamma/tmp/progname.core' (x86_64) was loaded.
(lldb)

(lldb) thread backtrace all
 thread #1, name = 'progname', stop reason = signal SIGSEGV
   frame #0: 0x0000000000201347 progname`bazz(anint=5) at temp2.c:17:10
    frame #1: 0x0000000000201312 progname`main at temp2.c:10:2
    frame #2: 0x000000000020110f progname`_start(ap=<unavailable>, cleanup=<unavailable>) at crt1.c:76:7
(lldb)

2.6.2.4. 使用 lldb 附加到正在运行的程序

为此，启动另一个 lldb，使用 ps 查找子进程的进程 ID，然后在 lldb 中执行

(lldb) process attach -p pid

然后像往常一样进行调试。

为了让这个过程顺利工作，调用 fork 创建子进程的代码需要做如下处理（摘自 gdb 的信息页面）：

...
if ((pid = fork()) < 0)		/* _始终_ 检查这个 */
	error();
else if (pid == 0) {		/* 子进程 */
	int PauseMode = 1;

	while (PauseMode)
		sleep(10);	/* 等待直到有人附加到我们 */
	...
} else {			/* 父进程 */
	...

现在，只需要附加到子进程，在 lldb 中执行 expr PauseMode = 0，并等待 sleep() 调用返回。

2.6.3. 使用 LLDB 进行远程调试

注意
从 LLDB 版本 12.0.0 开始，支持在 FreeBSD 上进行远程调试。使用早期 LLDB 版本的 FreeBSD 版本的用户可能希望使用中提供的快照，如。

要启动一个需要远程调试的程序，请在远程服务器上运行 lldb-server，命令如下：

% lldb-server g host:port -- progname

程序启动后会立即停止，lldb-server 会等待客户端的连接。

然后，在本地启动 lldb，并输入以下命令来连接到远程服务器：

(lldb) gdb-remote host:port

lldb-server 也可以附加到一个正在运行的进程。要做到这一点，在远程服务器上输入以下命令：

% lldb-server g host:port --attach pid-or-name

2.6.4. 使用 gdb

2.6.4.1. 启动 gdb

通过输入以下命令启动 gdb：

% gdb progname

不过许多人更喜欢在 Emacs 中运行它。要在 Emacs 中运行，输入：

M-x gdb RET progname RET

最后，对于那些觉得文本命令提示风格不太友好的人，Ports 集合中有一个图形前端（）可以使用。

2.6.4.2. 使用 gdb 运行程序

... (no debugging symbols found) ...

这意味着程序没有使用 -g 编译。

要逐行调试程序，可以按 n。当遇到函数调用时，按 s 步入该函数。进入函数后，按 f 返回，或者使用 up 和 down 快速查看调用者。

以下是使用 gdb 找到程序错误的一个简单示例。我们有如下程序（包含一个故意的错误）：

#include <stdio.h>

int bazz(int anint);

main() {
	int i;

	printf("This is my program\n");
	bazz(i);
	return 0;
}

int bazz(int anint) {
	printf("You gave me %d\n", anint);
	return anint;
}

该程序将 i 设置为 5，并将其传递给函数 bazz()，该函数打印出我们给它的数字。

编译并运行该程序，输出为：

% cc -g -o temp temp.c
% ./temp
This is my program
anint = 4231

这不是我们期望的结果！是时候看看发生了什么！

% gdb temp
GDB is free software and you are welcome to distribute copies of it
 under certain conditions; type "show copying" to see the conditions.
There is absolutely no warranty for GDB; type "show warranty" for details.
GDB 4.13 (i386-unknown-freebsd), Copyright 1994 Free Software Foundation, Inc.
(gdb) break main				跳过设置代码
Breakpoint 1 at 0x160f: file temp.c, line 9.	gdb 在 main() 设置断点
(gdb) run					运行到 main()
Starting program: /home/james/tmp/temp		程序开始运行

Breakpoint 1, main () at temp.c:9		gdb 在 main() 停止
(gdb) n						执行下一行
This is my program				程序输出
(gdb) s						步入 bazz()
bazz (anint=4231) at temp.c:17			gdb 显示堆栈帧
(gdb)

等一下！anint 怎么成了 4231？它不是在 main() 中被设置为 5 吗？让我们回到 main()，看看。

(gdb) up					回到调用栈
#1  0x1625 in main () at temp.c:11		gdb 显示堆栈帧
(gdb) p i					显示 i 的值
$1 = 4231					gdb 显示 i 的值是 4231

哦，天哪！查看代码，我们忘记初始化 i 了。我们本来应该写：

...
main() {
	int i;

	i = 5;
	printf("This is my program\n");
...

但我们忘了写 i=5; 这一行。由于没有初始化 i，它包含了程序运行时该内存区域的任意值，而在这个情况下，恰好是 4231。

注意
每次进入或退出一个函数时，gdb 命令都会显示堆栈帧，即使我们使用 up 和 down 来在调用栈中移动。这显示了函数的名称和其参数的值，这有助于我们跟踪当前的位置和发生了什么。（堆栈是程序存储有关传递给函数的参数以及返回时应该去哪里的信息的区域。）

2.6.4.3. 使用 gdb 检查 Core 文件

要检查一个 core 文件，像平常一样启动 gdb。不过，不需要输入 break 或 run，而是输入：

(gdb) core progname.core

如果 core 文件不在当前目录中，首先输入 dir /path/to/core/file。

调试器应该会显示如下信息：

% gdb progname
GDB is free software and you are welcome to distribute copies of it
 under certain conditions; type "show copying" to see the conditions.
There is absolutely no warranty for GDB; type "show warranty" for details.
GDB 4.13 (i386-unknown-freebsd), Copyright 1994 Free Software Foundation, Inc.
(gdb) core progname.core
Core was generated by `progname'.
Program terminated with signal 11, Segmentation fault.
Cannot access memory at address 0x7020796d.
#0  0x164a in bazz (anint=0x5) at temp.c:17
(gdb)

有时查看函数是如何被调用的很有用，因为问题可能出现在复杂程序中的调用栈的更高层。bt 命令会让 gdb 打印出调用栈的回溯信息：

(gdb) bt
#0  0x164a in bazz (anint=0x5) at temp.c:17
#1  0xefbfd888 in end ()
#2  0x162c in main () at temp.c:11
(gdb)

end() 函数在程序崩溃时被调用；在这种情况下，bazz() 函数是从 main() 被调用的。

2.6.4.4. 附加到正在运行的程序

为此，可以启动另一个 gdb，使用 ps 查找子进程的 PID，然后在 gdb 中执行：

(gdb) attach pid

然后像平常一样调试。

为了让这个过程顺利工作，调用 fork 来创建子进程的代码需要像以下这样写（摘自 gdb 的信息页面）：

...
if ((pid = fork()) < 0)		/* _Always_ check this */
	error();
else if (pid == 0) {		/* child */
	int PauseMode = 1;

	while (PauseMode)
		sleep(10);	/* 等待直到有人附加到我们 */
	...
} else {			/* parent */
	...

现在，只需附加到子进程，将 PauseMode 设置为 0，并等待 sleep() 调用返回即可！

2.7. 使用 Emacs 作为开发环境

2.7.1. Emacs

在这里简要总结 Emacs 能做的所有事情几乎是不可能的，但以下是一些对开发者有用的功能：

非常强大的编辑器，支持对字符串和正则表达式（模式）进行搜索和替换，跳转到代码块的开始/结束等。
下拉菜单和在线帮助。
语言相关的语法高亮和缩进。
完全可定制。
你可以在 Emacs 中编译和调试程序。
当编译出错时，你可以跳转到源代码中的错误行。
提供一个友好的前端来使用 info 程序，阅读 GNU 超文本文档，包括 Emacs 本身的文档。
提供一个友好的前端来使用 gdb，允许你在程序调试时查看源代码。

当然，还有许多其他功能未被列出。

Emacs 可以通过 FreeBSD 的端口进行安装。

2.7.2. 配置 Emacs

Emacs 有许多奇妙的功能；其中一些是内建的，有些则需要配置。

学习 Emacs Lisp 的最佳方式是阅读在线的手册。

2.7.3. 示例 .emacs

不幸的是，这里有太多内容需要详细解释；然而，有一两个值得一提的要点。

以 ; 开头的所有内容都是注释，Emacs 会忽略它们。
在第一行，-<strong>- Emacs-Lisp -</strong>- 是为了使我们能够在 Emacs 内部编辑 .emacs 文件，并获得所有编辑 Emacs Lisp 的高级功能。Emacs 通常会根据文件名尝试猜测这一点，但可能不会为 .emacs 文件正确识别。
Tab 键在某些模式下绑定到缩进功能，因此当你按下 Tab 键时，它会缩进当前的代码行。如果你想在写的内容中插入一个 Tab 字符，可以在按 Tab 键时按住控制键。
该文件支持 C、C++、Perl、Lisp 和 Scheme 的语法高亮，通过从文件名猜测语言来启用。
Emacs 已经有一个预定义的函数 next-error。在编译输出窗口中，它允许你通过执行 M-n 从一个编译错误跳到下一个；我们定义了一个互补函数 previous-error，允许你通过执行 M-p 跳转到前一个错误。最好的功能是，C-c C-c 会打开发生错误的源文件并跳转到相应的行。
我们启用 Emacs 的服务器功能，这样，如果你在 Emacs 之外做一些事情，想要编辑一个文件，只需输入
```
% emacsclient filename
```
然后你就可以在 Emacs 中编辑该文件！^[]^

示例 1 .emacs

;; -*-Emacs-Lisp-*-

;; This file is designed to be re-evaled; use the variable first-time
;; to avoid any problems with this.
(defvar first-time t
  "Flag signifying this is the first time that .emacs has been evaled")

;; Meta
(global-set-key "\M- " 'set-mark-command)
(global-set-key "\M-\C-h" 'backward-kill-word)
(global-set-key "\M-\C-r" 'query-replace)
(global-set-key "\M-r" 'replace-string)
(global-set-key "\M-g" 'goto-line)
(global-set-key "\M-h" 'help-command)

;; Function keys
(global-set-key [f1] 'manual-entry)
(global-set-key [f2] 'info)
(global-set-key [f3] 'repeat-complex-command)
(global-set-key [f4] 'advertised-undo)
(global-set-key [f5] 'eval-current-buffer)
(global-set-key [f6] 'buffer-menu)
(global-set-key [f7] 'other-window)
(global-set-key [f8] 'find-file)
(global-set-key [f9] 'save-buffer)
(global-set-key [f10] 'next-error)
(global-set-key [f11] 'compile)
(global-set-key [f12] 'grep)
(global-set-key [C-f1] 'compile)
(global-set-key [C-f2] 'grep)
(global-set-key [C-f3] 'next-error)
(global-set-key [C-f4] 'previous-error)
(global-set-key [C-f5] 'display-faces)
(global-set-key [C-f8] 'dired)
(global-set-key [C-f10] 'kill-compilation)

;; Keypad bindings
(global-set-key [up] "\C-p")
(global-set-key [down] "\C-n")
(global-set-key [left] "\C-b")
(global-set-key [right] "\C-f")
(global-set-key [home] "\C-a")
(global-set-key [end] "\C-e")
(global-set-key [prior] "\M-v")
(global-set-key [next] "\C-v")
(global-set-key [C-up] "\M-\C-b")
(global-set-key [C-down] "\M-\C-f")
(global-set-key [C-left] "\M-b")
(global-set-key [C-right] "\M-f")
(global-set-key [C-home] "\M-<")
(global-set-key [C-end] "\M->")
(global-set-key [C-prior] "\M-<")
(global-set-key [C-next] "\M->")

;; Mouse
(global-set-key [mouse-3] 'imenu)

;; Misc
(global-set-key [C-tab] "\C-q\t")	; Control tab quotes a tab.
(setq backup-by-copying-when-mismatch t)

;; Treat 'y' or <CR> as yes, 'n' as no.
(fset 'yes-or-no-p 'y-or-n-p)
(define-key query-replace-map [return] 'act)
(define-key query-replace-map [?\C-m] 'act)

;; Load packages
(require 'desktop)
(require 'tar-mode)

;; Pretty diff mode
(autoload 'ediff-buffers "ediff" "Intelligent Emacs interface to diff" t)
(autoload 'ediff-files "ediff" "Intelligent Emacs interface to diff" t)
(autoload 'ediff-files-remote "ediff"
  "Intelligent Emacs interface to diff")

(if first-time
    (setq auto-mode-alist
	  (append '(("\\.cpp$" . c++-mode)
		    ("\\.hpp$" . c++-mode)
		    ("\\.lsp$" . lisp-mode)
		    ("\\.scm$" . scheme-mode)
		    ("\\.pl$" . perl-mode)
		    ) auto-mode-alist)))

;; Auto font lock mode
(defvar font-lock-auto-mode-list
  (list 'c-mode 'c++-mode 'c++-c-mode 'emacs-lisp-mode 'lisp-mode 'perl-mode 'scheme-mode)
  "List of modes to always start in font-lock-mode")

(defvar font-lock-mode-keyword-alist
  '((c++-c-mode . c-font-lock-keywords)
    (perl-mode . perl-font-lock-keywords))
  "Associations between modes and keywords")

(defun font-lock-auto-mode-select ()
  "Automatically select font-lock-mode if the current major mode is in font-lock-auto-mode-list"
  (if (memq major-mode font-lock-auto-mode-list)
      (progn
	(font-lock-mode t))
    )
  )

(global-set-key [M-f1] 'font-lock-fontify-buffer)

;; New dabbrev stuff
;(require 'new-dabbrev)
(setq dabbrev-always-check-other-buffers t)
(setq dabbrev-abbrev-char-regexp "\\sw\\|\\s_")
(add-hook 'emacs-lisp-mode-hook
	  '(lambda ()
	     (set (make-local-variable 'dabbrev-case-fold-search) nil)
	     (set (make-local-variable 'dabbrev-case-replace) nil)))
(add-hook 'c-mode-hook
	  '(lambda ()
	     (set (make-local-variable 'dabbrev-case-fold-search) nil)
	     (set (make-local-variable 'dabbrev-case-replace) nil)))
(add-hook 'text-mode-hook
	  '(lambda ()
	     (set (make-local-variable 'dabbrev-case-fold-search) t)
	     (set (make-local-variable 'dabbrev-case-replace) t)))

;; C++ and C mode...
(defun my-c++-mode-hook ()
  (setq tab-width 4)
  (define-key c++-mode-map "\C-m" 'reindent-then-newline-and-indent)
  (define-key c++-mode-map "\C-ce" 'c-comment-edit)
  (setq c++-auto-hungry-initial-state 'none)
  (setq c++-delete-function 'backward-delete-char)
  (setq c++-tab-always-indent t)
  (setq c-indent-level 4)
  (setq c-continued-statement-offset 4)
  (setq c++-empty-arglist-indent 4))

(defun my-c-mode-hook ()
  (setq tab-width 4)
  (define-key c-mode-map "\C-m" 'reindent-then-newline-and-indent)
  (define-key c-mode-map "\C-ce" 'c-comment-edit)
  (setq c-auto-hungry-initial-state 'none)
  (setq c-delete-function 'backward-delete-char)
  (setq c-tab-always-indent t)
;; BSD-ish indentation style
  (setq c-indent-level 4)
  (setq c-continued-statement-offset 4)
  (setq c-brace-offset -4)
  (setq c-argdecl-indent 0)
  (setq c-label-offset -4))

;; Perl mode
(defun my-perl-mode-hook ()
  (setq tab-width 4)
  (define-key c++-mode-map "\C-m" 'reindent-then-newline-and-indent)
  (setq perl-indent-level 4)
  (setq perl-continued-statement-offset 4))

;; Scheme mode...
(defun my-scheme-mode-hook ()
  (define-key scheme-mode-map "\C-m" 'reindent-then-newline-and-indent))

;; Emacs-Lisp mode...
(defun my-lisp-mode-hook ()
  (define-key lisp-mode-map "\C-m" 'reindent-then-newline-and-indent)
  (define-key lisp-mode-map "\C-i" 'lisp-indent-line)
  (define-key lisp-mode-map "\C-j" 'eval-print-last-sexp))

;; Add all of the hooks...
(add-hook 'c++-mode-hook 'my-c++-mode-hook)
(add-hook 'c-mode-hook 'my-c-mode-hook)
(add-hook 'scheme-mode-hook 'my-scheme-mode-hook)
(add-hook 'emacs-lisp-mode-hook 'my-lisp-mode-hook)
(add-hook 'lisp-mode-hook 'my-lisp-mode-hook)
(add-hook 'perl-mode-hook 'my-perl-mode-hook)

;; Complement to next-error
(defun previous-error (n)
  "Visit previous compilation error message and corresponding source code."
  (interactive "p")
  (next-error (- n)))

;; Misc...
(transient-mark-mode 1)
(setq mark-even-if-inactive t)
(setq visible-bell nil)
(setq next-line-add-newlines nil)
(setq compile-command "make")
(setq suggest-key-bindings nil)
(put 'eval-expression 'disabled nil)
(put 'narrow-to-region 'disabled nil)
(put 'set-goal-column 'disabled nil)
(if (>= emacs-major-version 21)
	(setq show-trailing-whitespace t))

;; Elisp archive searching
(autoload 'format-lisp-code-directory "lispdir" nil t)
(autoload 'lisp-dir-apropos "lispdir" nil t)
(autoload 'lisp-dir-retrieve "lispdir" nil t)
(autoload 'lisp-dir-verify "lispdir" nil t)

;; Font lock mode
(defun my-make-face (face color &optional bold)
  "Create a face from a color and optionally make it bold"
  (make-face face)
  (copy-face 'default face)
  (set-face-foreground face color)
  (if bold (make-face-bold face))
  )

(if (eq window-system 'x)
    (progn
      (my-make-face 'blue "blue")
      (my-make-face 'red "red")
      (my-make-face 'green "dark green")
      (setq font-lock-comment-face 'blue)
      (setq font-lock-string-face 'bold)
      (setq font-lock-type-face 'bold)
      (setq font-lock-keyword-face 'bold)
      (setq font-lock-function-name-face 'red)
      (setq font-lock-doc-string-face 'green)
      (add-hook 'find-file-hooks 'font-lock-auto-mode-select)

      (setq baud-rate 1000000)
      (global-set-key "\C-cmm" 'menu-bar-mode)
      (global-set-key "\C-cms" 'scroll-bar-mode)
      (global-set-key [backspace] 'backward-delete-char)
					;      (global-set-key [delete] 'delete-char)
      (standard-display-european t)
      (load-library "iso-transl")))

;; X11 or PC using direct screen writes
(if window-system
    (progn
      ;;      (global-set-key [M-f1] 'hilit-repaint-command)
      ;;      (global-set-key [M-f2] [?\C-u M-f1])
      (setq hilit-mode-enable-list
	    '(not text-mode c-mode c++-mode emacs-lisp-mode lisp-mode
		  scheme-mode)
	    hilit-auto-highlight nil
	    hilit-auto-rehighlight 'visible
	    hilit-inhibit-hooks nil
	    hilit-inhibit-rebinding t)
      (require 'hilit19)
      (require 'paren))
  (setq baud-rate 2400)			; For slow serial connections
  )

;; TTY type terminal
(if (and (not window-system)
	 (not (equal system-type 'ms-dos)))
    (progn
      (if first-time
	  (progn
	    (keyboard-translate ?\C-h ?\C-?)
	    (keyboard-translate ?\C-? ?\C-h)))))

;; Under UNIX
(if (not (equal system-type 'ms-dos))
    (progn
      (if first-time
	  (server-start))))

;; Add any face changes here
(add-hook 'term-setup-hook 'my-term-setup-hook)
(defun my-term-setup-hook ()
  (if (eq window-system 'pc)
      (progn
;;	(set-face-background 'default "red")
	)))

;; Restore the "desktop" - do this as late as possible
(if first-time
    (progn
      (desktop-load-default)
      (desktop-read)))

;; Indicate that this file has been read at least once
(setq first-time nil)

;; No need to debug anything now

(setq debug-on-error nil)

;; All done
(message "All done, %s%s" (user-login-name) ".")

2.7.4. 扩展 Emacs 支持的语言范围

% find /usr/ports/lang/whizbang -name "*.el" -print

然后将这些文件复制到 Emacs 的 site-lisp 目录中进行安装。在 FreeBSD 中，site-lisp 目录是 /usr/local/share/emacs/site-lisp。

例如，如果 find 命令的输出是：

/usr/ports/lang/whizbang/work/misc/whizbang.el

那么我们应该执行：

# cp /usr/ports/lang/whizbang/work/misc/whizbang.el /usr/local/share/emacs/site-lisp

找到 .emacs 中的 auto-mode-alist 条目，然后添加一行，如下所示：

...
("\\.lsp$" . lisp-mode)
("\\.wiz$" . whizbang-mode)
("\\.scm$" . scheme-mode)
...

这意味着当你编辑一个以 .wiz 结尾的文件时，Emacs 会自动进入 whizbang-mode。

接下来，在 .emacs 中找到 font-lock-auto-mode-list 条目。像这样将 whizbang-mode 添加到其中：

;; 自动字体锁定模式
(defvar font-lock-auto-mode-list
  (list 'c-mode 'c++-mode 'c++-c-mode 'emacs-lisp-mode 'whizbang-mode 'lisp-mode 'perl-mode 'scheme-mode)
  "始终启用字体锁定模式的模式列表")

这意味着当编辑一个 .wiz 文件时，Emacs 会始终启用 font-lock-mode（即语法高亮）。

2.8. 进一步阅读

关于如何设置开发环境以便为 FreeBSD 本身贡献修复，请参阅。

Brian Harvey 和 Matthew Wright Simply Scheme MIT 1994. ISBN 0-262-08226-8
Randall Schwartz Learning Perl O’Reilly 1993 ISBN 1-56592-042-2
Patrick Henry Winston 和 Berthold Klaus Paul Horn Lisp (3rd Edition) Addison-Wesley 1989 ISBN 0-201-08319-1
Brian W. Kernighan 和 Rob Pike The Unix Programming Environment Prentice-Hall 1984 ISBN 0-13-937681-X
Brian W. Kernighan 和 Dennis M. Ritchie The C Programming Language (2nd Edition) Prentice-Hall 1988 ISBN 0-13-110362-8
Bjarne Stroustrup The C++ Programming Language Addison-Wesley 1991 ISBN 0-201-53992-6
W. Richard Stevens Advanced Programming in the Unix Environment Addison-Wesley 1992 ISBN 0-201-56317-7
W. Richard Stevens Unix Network Programming Prentice-Hall 1990 ISBN 0-13-949876-1

. 如果你在 shell 中运行它，可能会得到核心转储。

. 如果你不知道，二进制排序是一种高效的排序方式，而冒泡排序则不是。

. 这背后的原因深藏在历史的迷雾中。

. 请注意，我们没有使用 -o 标志来指定可执行文件名，所以我们将得到一个名为 a.out 的可执行文件。生成一个名为 foobar 的调试版本留给读者自己完成！

. 它们不使用 MAKEFILE 格式，因为大写字母通常用于文档文件，比如 README。

. 许多 Emacs 用户将他们的 EDITOR 环境设置为 emacsclient，这样每当他们需要编辑文件时，Emacs 就会启动。

第 7 章套接字

7.1. 概述

BSD socket 将进程间通信提升到了一个新的层次。通信的进程不再必须运行在同一台机器上。它们可以运行在同一台机器上，但不再是必须的。

而你的软件同样可以与运行在另一栋楼、另一个大陆、甚至潜艇或航天飞机中的进程协作。

7.2. 网络与多样性

我们已经暗示过网络的多样性。许多不同的系统必须彼此通信。而它们必须讲相同的语言。它们还必须以相同的方式理解这种语言。

7.3. 协议

由于数据通信中使用的语言非常简洁，我们通常将其称为协议，而不是语言。

图 1. 协议层

在这个例子中，我们正在尝试从一个通过以太网连接的网页中获取一张图片。

图片由原始数据组成，原始数据只是一个 RGB 值的序列，我们的软件可以处理这些值，即将其转换为图像并显示在显示器上。

我想你已经明白了……

为了告诉我们的软件如何处理这些原始数据，它被编码为 PNG 文件。它也可以是 GIF 文件，或者 JPEG 文件，但它是 PNG。

而 PNG 就是一个协议。

在这个时候，我听到有些人喊道：“不，它不是！它是文件格式！”

所以，现在我们收到了一个包裹在 PNG 协议中的数据，再包裹在 HTTP 协议中。那我们是如何从服务器获得它的呢？

是通过 Ethernet 上的 TCP/IP 来的，实际上那是三个协议。为了更容易解释接下来的内容，我现在将重点讲解 Ethernet。

正是 TCP（传输控制协议）要求发送方重新发送任何丢失的数据，并将所有数据按正确的顺序排列。

作为开发人员，你现在应该会问：“我该如何处理这一切？”

换句话说，你不需要做任何事情来接收来自另一台计算机的数据。嗯，你确实需要请求它，但这几乎就像打开一个文件一样简单。

一旦你接收到数据，就由你来决定如何处理它。在我们的例子中，你需要理解 HTTP 协议和 PNG 文件结构。

图 2. 套接字覆盖的协议层

我们只需要理解任何告诉我们如何解释数据的协议，而不是如何从另一个进程接收数据，或如何发送数据到另一个进程。

7.4. 套接字模型

由于互联网的复杂性，我们不能简单地使用 open 系统调用或 open() C 函数。相反，我们需要采取多个步骤来“打开”一个套接字。

然而，一旦我们完成这些步骤，我们就可以开始像处理任何文件描述符一样处理套接字：我们可以从中read、write、pipe，最后close它。

7.5. 必要的套接字函数

虽然 FreeBSD 提供了多种函数来操作套接字，但我们只需要四个来“打开”一个套接字。在某些情况下，我们甚至只需要两个。

7.5.1. 客户端与服务器的区别

通常，套接字数据通信的一端是服务器，另一端是客户端。

7.5.1.1. 共同的元素

7.5.1.1.1. socket

客户端和服务器都使用的一个函数是。它的声明如下：

int socket(int domain, int type, int protocol);

返回值与 open 相同，都是整数。FreeBSD 从与文件句柄相同的池中分配它的值。这使得套接字可以像文件一样被处理。

domain 参数告诉系统你希望使用的协议族。有许多协议族，其中一些是厂商特定的，其他的则是常见的。它们在 sys/socket.h 中声明。

对于 UDP、TCP 和其他 Internet 协议（IPv4），使用 PF_INET。

如果你请求的是 SOCK_DGRAM，你将请求一个无连接的数据报传输服务（在我们的例子中是 UDP）。

如果你想控制底层协议（如 IP），甚至是网络接口（如以太网），你需要指定 SOCK_RAW。

最后，protocol 参数取决于前两个参数，并非总是有意义。在这种情况下，可以将其值设置为 0。

注意
未连接的套接字在 socket 函数中，我们并没有指定该套接字要连接到哪个其他系统。我们新创建的套接字仍然是未连接的。这是故意的：用电话的类比来说，我们刚刚将调制解调器接入电话线。我们既没有告诉调制解调器拨打电话，也没有告诉它在电话响起时接听。

7.5.1.1.2. sockaddr

/*
 * 内核用于存储大多数地址的结构
 */
struct sockaddr {
	unsigned char	sa_len;		/* 总长度 */
	sa_family_t	sa_family;	/* 地址族 */
	char		sa_data[14];	/* 实际上更长；地址值 */
};
#define	SOCK_MAXADDRLEN	255		/* 最长的可能地址 */

请注意 sa_data 字段的模糊性，它仅声明为 14 字节的数组，注释提示它可能包含超过 14 字节的数据。

sys/socket.h 将套接字所处理的各种协议称为地址族，并在 sockaddr 定义之前列出它们：

/*
 * 地址族
 */
#define	AF_UNSPEC	0		/* 未指定 */
#define	AF_LOCAL	1		/* 本地主机（管道、端口） */
#define	AF_UNIX		AF_LOCAL	/* 向后兼容 */
#define	AF_INET		2		/* 内联网：UDP、TCP 等 */
#define	AF_IMPLINK	3		/* ARPANET IMP 地址 */
#define	AF_PUP		4		/* PUP 协议：如 BSP */
#define	AF_CHAOS	5		/* MIT CHAOS 协议 */
#define	AF_NS		6		/* XEROX NS 协议 */
#define	AF_ISO		7		/* ISO 协议 */
#define	AF_OSI		AF_ISO
#define	AF_ECMA		8		/* 欧洲计算机制造商 */
#define	AF_DATAKIT	9		/* DataKit 协议 */
#define	AF_CCITT	10		/* CCITT 协议，X.25 等 */
#define	AF_SNA		11		/* IBM SNA */
#define AF_DECnet	12		/* DECnet */
#define AF_DLI		13		/* DEC 直接数据链路接口 */
#define AF_LAT		14		/* LAT */
#define	AF_HYLINK	15		/* NSC 超级通道 */
#define	AF_APPLETALK	16		/* Apple Talk */
#define	AF_ROUTE	17		/* 内部路由协议 */
#define	AF_LINK		18		/* 链路层接口 */
#define	pseudo_AF_XTP	19		/* eXpress Transfer 协议（无 AF） */
#define	AF_COIP		20		/* 面向连接的 IP，亦称 ST II */
#define	AF_CNT		21		/* 计算机网络技术 */
#define pseudo_AF_RTIP	22		/* 帮助识别 RTIP 包 */
#define	AF_IPX		23		/* Novell Internet 协议 */
#define	AF_SIP		24		/* 简单互联网协议 */
#define	pseudo_AF_PIP	25		/* 帮助识别 PIP 包 */
#define	AF_ISDN		26		/* 综合服务数字网络 */
#define	AF_E164		AF_ISDN		/* CCITT E.164 推荐 */
#define	pseudo_AF_KEY	27		/* 内部密钥管理功能 */
#define	AF_INET6	28		/* IPv6 */
#define	AF_NATM		29		/* 原生 ATM 访问 */
#define	AF_ATM		30		/* ATM */
#define pseudo_AF_HDRCMPLT 31		/* BPF 用于不重写头部
					 * 在接口输出例程中
					 */
#define	AF_NETGRAPH	32		/* Netgraph 套接字 */
#define	AF_SLOW		33		/* 802.3ad 慢协议 */
#define	AF_SCLUSTER	34		/* Sitara 集群协议 */
#define	AF_ARP		35
#define	AF_BLUETOOTH	36		/* 蓝牙套接字 */
#define	AF_MAX		37

用于 IP 的是 AF_INET，它是常量 2 的符号表示。

正是 sockaddr 中列出的 地址族 决定了如何使用 sa_data 字段中那些模糊命名的字节。

具体来说，当地址族为 AF_INET 时，我们可以在需要 sockaddr 的地方使用 netinet/in.h 中的 struct sockaddr_in：

/*
 * 套接字地址，互联网风格。
 */
struct sockaddr_in {
	uint8_t		sin_len;
	sa_family_t	sin_family;
	in_port_t	sin_port;
	struct	in_addr sin_addr;
	char	sin_zero[8];
};

我们可以通过以下方式可视化它的组织结构：

图 3. sockaddr_in 结构

图 4. sockaddr_in 的具体示例

顺便提一下，sin_addr 字段被声明为 struct in_addr 类型，它在 netinet/in.h 中定义：

/*
 * Internet 地址（出于历史原因的结构）
 */
struct in_addr {
	in_addr_t s_addr;
};

此外，in_addr_t 是一个 32 位的整数。

192.43.244.18 只是通过列出其所有 8 位字节（从最重要的字节开始）来表示一个 32 位整数的便捷表示法。

假设我们编写了如下代码：

sa.sin_family      = AF_INET;
sa.sin_port        = 13;
sa.sin_addr.s_addr = (((((192 << 8) | 43) << 8) | 244) << 8) | 18;

结果会是什么样子呢？

当然，这取决于具体的计算机系统。在一个奔腾或其他 x86 系统上，它会像这样显示：

图 5. 在 Intel 系统上的 sockaddr_in

在不同的系统上，可能会是这样的：

图 6. 在 MSB 系统上的 sockaddr_in

在 PDP 上，它的表现可能又会不同。但上述两种方式是如今最常见的两种实现方式。

为什么？

因为在与另一台计算机通信时，你通常不知道它是以 最高有效字节（MSB）优先还是 最低有效字节（LSB）优先来存储数据的。

你可能会想，“那 sockets 难道不会替我处理这些吗？”

不会。

但对 sockets 而言，其余的数据就只是 sa_data[14]。根据 地址族 的不同，sockets 只是将这些数据转发到目标地。

同样，我们输入 IP 地址，是为了告诉网络上的所有中间设备数据应该被送往何处。sockets 依旧只是将其当作数据转发。

这就是为什么，我们（程序员，而不是 sockets）必须区分我们的计算机使用的字节序与用于发送给另一台计算机的标准字节序。

我们称我们的计算机使用的字节序为 主机字节序，简称 主机序。

而在 IP 上传送多字节数据有一个约定，就是以 MSB 优先 的方式传送。我们称这种顺序为 网络字节序，简称 网络序。

现在，如果我们将上面的代码编译为运行在 Intel 架构的计算机上，我们的 主机字节序 将会产生如下结果：

图 7. Intel 系统上的主机字节序

但 网络字节序 要求我们以 MSB 优先的方式存储数据：

图 8. 网络字节序

不幸的是，我们的 主机序 与 网络序 完全相反。

我们有几种方式可以应对这种情况。其中一种方法是在代码中反转这些值：

sa.sin_family      = AF_INET;
sa.sin_port        = 13 << 8;
sa.sin_addr.s_addr = (((((18 << 8) | 244) << 8) | 43) << 8) | 192;

假设你用 C 写了一个基于 sockets 的程序。你知道它会运行在奔腾上，于是你将所有常量反转后强行设为 网络字节序。一切正常。

最终，你搞清楚了问题的根源，骂了几句脏话，然后开始重写你的代码。

幸运的是，你不是第一个遇到这个问题的人。早有人已经创建了和这两个 C 函数，分别用于将 short 和 long 从 主机字节序 转换为 网络字节序；还有和函数，用于反向转换。

在 MSB 优先 的系统上，这些函数不会进行任何操作。而在 LSB 优先 的系统上，它们会将值转换为正确的顺序。

所以，无论你的软件是在哪个系统上编译的，只要使用这些函数，你的数据最终就会以正确的顺序被传送出去。

7.5.1.2. 客户端函数

7.5.1.2.1. connect

客户端创建了 socket 后，就需要将其连接到远程系统的一个特定端口。它会使用：

int connect(int s, const struct sockaddr *name, socklen_t namelen);

如果 connect 调用成功，它会返回 0。否则返回 -1，并将错误代码存储在 errno 中。

7.5.1.2.2. 我们的第一个客户端

现在我们已经掌握足够知识，来编写一个非常简单的客户端程序，它将从 192.43.244.18 获取当前时间并打印到 stdout。

/*
 * daytime.c
 *
 * G. Adam Stanislav 编写
 */
#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <unistd.h>

int main() {
  int s, bytes;
  struct sockaddr_in sa;
  char buffer[BUFSIZ+1];

  if ((s = socket(PF_INET, SOCK_STREAM, 0)) < 0) {
    perror("socket");      // 打开 socket 失败
    return 1;
  }

  memset(&sa, '\0', sizeof(sa));  // 清空结构体

  sa.sin_family = AF_INET;                  // 使用 IPv4
  sa.sin_port = htons(13);                 // 端口号 13（daytime 服务）
  sa.sin_addr.s_addr = htonl((((((192 << 8) | 43) << 8) | 244) << 8) | 18);  // IP 地址

  if (connect(s, (struct sockaddr *)&sa, sizeof sa) < 0) {
    perror("connect");     // 连接失败
    close(s);              // 关闭 socket
    return 2;
  }

  while ((bytes = read(s, buffer, BUFSIZ)) > 0)
    write(1, buffer, bytes);  // 输出到标准输出

  close(s);  // 关闭连接
  return 0;
}

现在请打开编辑器，输入上述内容，保存为 daytime.c，然后编译并运行它：

% cc -O3 -o daytime daytime.c
% ./daytime

52079 01-06-19 02:29:25 50 0 1 543.9 UTC(NIST) *
%

在本例中，日期是 2001 年 6 月 19 日，时间是 UTC 时间 02:29:25。当然，你运行程序时的输出会有所不同。

7.5.1.3. 服务器函数

sockets 接口提供了三个基本函数来处理这一情况。

7.5.1.3.1. bind

端口就像电话线路上的分机：拨通一个号码后，还需要拨分机号才能联系到特定的人或部门。

IP 端口总共有 65535 个，但服务器通常只处理来自其中某一个端口的请求。这就像告诉电话总机我们正在工作，可以在某个特定分机上接电话。我们使用告诉 sockets 我们要监听哪个端口。

int bind(int s, const struct sockaddr *addr, socklen_t addrlen);

#define	INADDR_ANY		(u_int32_t)0x00000000

假设我们要写一个基于 TCP/IP 的 daytime 协议服务器。回忆一下，它使用端口 13。我们的 sockaddr_in 结构将如下所示：

图 9. 示例服务器 sockaddr_in

7.5.1.3.2. listen

服务器使用函数来确保这一切。

int listen(int s, int backlog);

这里的 backlog 参数告诉 sockets：在你还在处理上一个请求时，最多可以接受多少个挂起的请求。换句话说，它决定了待处理连接队列的最大长度。

7.5.1.3.3. accept

电话铃响之后，你接起电话，就建立了与客户端的连接。该连接会一直保持，直到你或客户端挂断为止。

服务器使用函数来接收连接：

int accept(int s, struct sockaddr *addr, socklen_t *addrlen);

注意这次 addrlen 是一个指针。这是因为在这个调用中由 socket 来填写 addr，也就是 sockaddr_in 结构。

返回值是一个整数。实际上，accept 返回的是一个 新 socket。你将使用这个新 socket 来与客户端通信。

那旧的 socket 呢？它仍然监听更多的请求（还记得我们传给 listen 的 backlog 吗？），直到我们调用 close。

而新的 socket 仅用于通信。它是完全连接的，不能再传给 listen 去接受其他连接。

7.5.1.3.4. 我们的第一个服务器

我们的第一个服务器比我们的第一个客户端要复杂一些：不仅使用了更多的 sockets 函数，而且我们需要将它写成一个守护进程（daemon）。

最好的方式是，在绑定端口之后创建一个 子进程。主进程随即退出，将控制权还给 shell（或调用它的其他程序）。

子进程调用 listen，然后进入一个无限循环，接受连接、提供服务、最终关闭该连接的 socket。

/*
 * daytimed - 一个监听端口 13 的服务器
 *
 * G. Adam Stanislav 编写
 * 2001 年 6 月 19 日
 */
#include <stdio.h>
#include <string.h>
#include <time.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>

#define BACKLOG 4

int main() {
    int s, c;
    socklen_t b;
    struct sockaddr_in sa;
    time_t t;
    struct tm *tm;
    FILE *client;

    if ((s = socket(PF_INET, SOCK_STREAM, 0)) < 0) {
        perror("socket");
        return 1;
    }

    memset(&sa, '\0', sizeof(sa));

    sa.sin_family = AF_INET;
    sa.sin_port   = htons(13);

    if (INADDR_ANY)
        sa.sin_addr.s_addr = htonl(INADDR_ANY);

    if (bind(s, (struct sockaddr *)&sa, sizeof sa) < 0) {
        perror("bind");
        return 2;
    }

    switch (fork()) {
        case -1:
            perror("fork");
            return 3;
        default:
            close(s);
            return 0;
        case 0:
            break;
    }

    listen(s, BACKLOG);

    for (;;) {
        b = sizeof sa;

        if ((c = accept(s, (struct sockaddr *)&sa, &b)) < 0) {
            perror("daytimed accept");
            return 4;
        }

        if ((client = fdopen(c, "w")) == NULL) {
            perror("daytimed fdopen");
            return 5;
        }

        if ((t = time(NULL)) < 0) {
            perror("daytimed time");
            return 6;
        }

        tm = gmtime(&t);
        fprintf(client, "%.4i-%.2i-%.2iT%.2i:%.2i:%.2iZ\n",
            tm->tm_year + 1900,
            tm->tm_mon + 1,
            tm->tm_mday,
            tm->tm_hour,
            tm->tm_min,
            tm->tm_sec);

        fclose(client);
    }
}

我们首先创建一个 socket。然后填写 sa 中的 sockaddr_in 结构体。注意对 INADDR_ANY 的条件使用：

if (INADDR_ANY)
        sa.sin_addr.s_addr = htonl(INADDR_ANY);

最后，守护进程启动一个无限循环，按以下步骤操作：

调用 accept。它会阻塞，直到有客户端连接。此时，它会获得一个新的 socket c，用于与这个特定客户端通信。
使用 C 函数 fdopen 将 socket 从底层 文件描述符 转换为 C 风格的 FILE 指针，这样可以后续使用 fprintf。
获取当前时间，并用 ISO 8601 格式打印到 client “文件”中。随后使用 fclose 关闭该文件，这也会自动关闭对应的 socket。

我们可以将这个模式泛化，作为许多其他服务器的模板：

图 10. 顺序服务器（Sequential Server）

这种流程图的优点在于，除了 fork 之后父进程退出之前那一瞬间，始终只有一个进程活跃：服务器不会占用太多内存和系统资源。

现在，请将上述源代码保存为 daytimed.c（按照惯例，守护进程的程序名以字母 d 结尾）。编译后尝试运行它：

% ./daytimed
bind: Permission denied
%

这次以超级用户身份再试一次：

# ./daytimed
#

什么…… 没有任何输出？我们再试一次：

# ./daytimed

bind: Address already in use
#

很好，我们知道它在后台运行。但它真的工作吗？怎么知道它是一个正确的 daytime 服务器？很简单：

% telnet localhost 13

Trying ::1...
telnet: connect to address ::1: Connection refused
Trying 127.0.0.1...
Connected to localhost.
Escape character is '^]'.
2001-06-19T21:04:42Z
Connection closed by foreign host.
%

telnet 先尝试使用新的 IPv6，失败后改用 IPv4 并成功连接。守护进程正常运行。

如果你能通过 telnet 访问另一台 UNIX® 系统，也可以用它来远程测试服务器。我所用的计算机没有静态 IP 地址，因此我做了如下测试：

% who

whizkid          ttyp0   Jun 19 16:59   (216.127.220.143)
xxx              ttyp1   Jun 19 16:06   (xx.xx.xx.xx)
% telnet 216.127.220.143 13

Trying 216.127.220.143...
Connected to r47.bfm.org.
Escape character is '^]'.
2001-06-19T21:31:11Z
Connection closed by foreign host.
%

它确实工作了。那么用域名也行吗？

% telnet r47.bfm.org 13

Trying 216.127.220.143...
Connected to r47.bfm.org.
Escape character is '^]'.
2001-06-19T21:31:40Z
Connection closed by foreign host.
%

7.6. 辅助函数

7.6.1. `gethostbyname`

虽然没有办法将域名直接传递给任何 socket 函数，但 FreeBSD 的 C 库提供了和这两个函数，它们在 netdb.h 中声明。

struct hostent * gethostbyname(const char *name);
struct hostent * gethostbyname2(const char *name, int af);

这使得我们可以创建一个更加灵活——也更加实用——的 daytime 程序版本：

/*
 * daytime.c
 *
 * 编写者：G. Adam Stanislav
 * 2001 年 6 月 19 日
 */
#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <netdb.h>

int main(int argc, char *argv[]) {
  int s, bytes;
  struct sockaddr_in sa;
  struct hostent *he;
  char buf[BUFSIZ+1];
  char *host;

  if ((s = socket(PF_INET, SOCK_STREAM, 0)) < 0) {
    perror("socket");
    return 1;
  }

  memset(&sa, '\0', sizeof(sa));

  sa.sin_family = AF_INET;
  sa.sin_port = htons(13);

  host = (argc > 1) ? argv[1] : "time.nist.gov";

  if ((he = gethostbyname(host)) == NULL) {
    herror(host);
    return 2;
  }

  memcpy(&sa.sin_addr, he->h_addr_list[0], he->h_length);

  if (connect(s, (struct sockaddr *)&sa, sizeof sa) < 0) {
    perror("connect");
    return 3;
  }

  while ((bytes = read(s, buf, BUFSIZ)) > 0)
    write(1, buf, bytes);

  close(s);
  return 0;
}

% daytime ; daytime localhost

52080 01-06-20 04:02:33 50 0 0 390.2 UTC(NIST) *
2001-06-20T04:02:35Z
%

如你所见，我的系统时间比 NIST 时间快了两秒。

7.6.2. `getservbyname`

有时候你可能不确定某个服务使用的端口号。此时，函数就非常有用，它同样在 netdb.h 中声明：

struct servent * getservbyname(const char *name, const char *proto);

servent 结构体包含 s_port 字段，其中保存了正确的端口号，且已经是 网络字节序。

如果我们事先不知道 daytime 服务使用的端口，可以这样获取：

struct servent *se;
  ...
  if ((se = getservbyname("daytime", "tcp")) == NULL {
    fprintf(stderr, "Cannot determine which port to use.\n");
    return 7;
  }
  sa.sin_port = se->s_port;

7.7. 并发服务器

这就要求我们对流程图进行重大改动：

图 11. 并发服务器

当 服务进程 完成服务后，它应关闭连接 socket。此时不再返回 accept，而是直接退出。

因此，守护进程 需要在 初始化阶段 设置 信号处理器。至少要处理 SIGCHLD 信号，以便清除子进程的返回值，并释放它们占用的系统资源。

第 10 章内核调试

10.1. 获取内核崩溃转储

一旦内核发生 panic，系统重启是不可避免的。一旦系统重启，系统物理内存（RAM）的内容将丢失，以及在崩溃前交换设备上的任何数据。为了保存物理内存中的数据，内核使用交换设备作为在崩溃后重启时存储 RAM 中数据的临时位置。这样，在 FreeBSD 崩溃后重新启动时，可以提取内核映像并进行调试。

注意
已配置为转储设备的交换设备仍然充当交换设备。当前不支持将转储写入非交换设备（例如磁带或 CDRW）。 “交换设备”等同于“交换分区”。

有几种类型的内核崩溃转储可供选择：

完整内存转储：包含物理内存的完整内容。
小型转储：仅包含内核使用的内存页（FreeBSD 6.2 及更高版本）。
文本转储：包含捕获的脚本或交互式调试器输出（FreeBSD 7.1 及更高版本）。

自 FreeBSD 7.0 起，小型转储是默认的转储类型，在大多数情况下，它会捕获完整内存转储中所有必要的信息，因为大多数问题只需要使用内核状态来进行隔离。

10.1.1. 配置转储设备

技巧

重要
在内核崩溃之前，确保在 rc.conf(5) 中指定的 dumpdir 已经存在！
# mkdir /var/crash
# chmod 700 /var/crash
另外，请记住，/var/crash 目录的内容是敏感的，极有可能包含诸如密码等机密信息。

10.1.2. 提取内核转储

技巧
如果你正在测试一个新的内核，但需要启动不同的内核才能使系统恢复正常，使用引导提示符中的 -s 标志将其仅引导到单用户模式，然后执行以下步骤：
# fsck -p
# mount -a -t ufs       # 确保 /var/crash 可写
# savecore /var/crash /dev/ad0s1b
# exit                  # 退出到多用户模式

10.1.3. 测试内核转储配置

# shutdown now
...
Enter full pathname of shell or RETURN for /bin/sh:
# mount -a -u -r
# sysctl debug.kdb.panic=1
debug.kdb.panic: panic: kdb_sysctl_panic
...

10.2. 使用 `kgdb` 调试内核崩溃转储

注意

要进入调试器并开始从转储中获取信息，启动 kgdb：

# kgdb -n N

其中 N 是要检查的 vmcore.N 后缀。要打开最近的转储，可以使用：

# kgdb -n last

# kgdb /boot/kernel/kernel /var/crash/vmcore.0

你可以像调试其他程序一样，使用内核源代码调试崩溃转储。

此转储来自 5.2-BETA 内核，崩溃发生在内核的深处。下面的输出已修改，左侧包含行号。此第一个跟踪检查指令指针并获得回溯。第 41 行用于 list 命令的地址是指令指针，可以在第 17 行找到。如果你无法自己调试问题，大多数开发人员会要求至少将这些信息发送给他们。如果你能够解决问题，确保通过问题报告、邮件列表或提交代码的方式将你的补丁合并到源代码树中！

 1:# cd /usr/obj/usr/src/sys/KERNCONF
 2:# kgdb kernel.debug /var/crash/vmcore.0
 3:GNU gdb 5.2.1 (FreeBSD)
 4:Copyright 2002 Free Software Foundation, Inc.
 5:GDB is free software, covered by the GNU General Public License, and you are
 6:welcome to change it and/or distribute copies of it under certain conditions.
 7:Type "show copying" to see the conditions.
 8:There is absolutely no warranty for GDB.  Type "show warranty" for details.
 9:This GDB was configured as "i386-undermydesk-freebsd"...
10:panic: page fault
11:panic messages:
12:---
13:Fatal trap 12: page fault while in kernel mode
14:cpuid = 0; apic id = 00
15:fault virtual address   = 0x300
16:fault code:             = supervisor read, page not present
17:instruction pointer     = 0x8:0xc0713860
18:stack pointer           = 0x10:0xdc1d0b70
19:frame pointer           = 0x10:0xdc1d0b7c
20:code segment            = base 0x0, limit 0xfffff, type 0x1b
21:                        = DPL 0, pres 1, def32 1, gran 1
22:processor eflags        = resume, IOPL = 0
23:current process         = 14394 (uname)
24:trap number             = 12
25:panic: page fault
26      cpuid = 0;
27:Stack backtrace:
28
29:syncing disks, buffers remaining... 2199 2199 panic: mi_switch: switch in a critical section
30:cpuid = 0;
31:Uptime: 2h43m19s
32:Dumping 255 MB
33: 16 32 48 64 80 96 112 128 144 160 176 192 208 224 240
34:---
35:Reading symbols from /boot/kernel/snd_maestro3.ko...done.
36:Loaded symbols for /boot/kernel/snd_maestro3.ko
37:Reading symbols from /boot/kernel/snd_pcm.ko...done.
38:Loaded symbols for /boot/kernel/snd_pcm.ko
39:#0  doadump () at /usr/src/sys/kern/kern_shutdown.c:240
40:240             dumping++;
41:(kgdb) list *0xc0713860
42:0xc0713860 is in lapic_ipi_wait (/usr/src/sys/i386/i386/local_apic.c:663).
43:658                     incr = 0;
44:659                     delay = 1;
45:660             } else
46:661                     incr = 1;
47:662             for (x = 0; x < delay; x += incr) {
48:663                     if ((lapic->icr_lo & APIC_DELSTAT_MASK) == APIC_DELSTAT_IDLE)
49:664                             return (1);
50:665                     ia32_pause();
51:666             }
52:667             return (0);
53:(kgdb) backtrace
54:#0  doadump () at /usr/src/sys/kern/kern_shutdown.c:240
55:#1  0xc055fd9b in boot (howto=260) at /usr/src/sys/kern/kern_shutdown.c:372
56:#2  0xc056019d in panic () at /usr/src/sys/kern/kern_shutdown.c:550
57:#3  0xc0567ef5 in mi_switch () at /usr/src/sys/kern/kern_synch.c:470
58:#4  0xc055fa87 in boot (howto=256) at /usr/src/sys/kern/kern_shutdown.c:312
59:#5  0xc056019d in panic () at /usr/src/sys/kern/kern_shutdown.c:550
60:#6  0xc0720c66 in trap_fatal (frame=0xdc1d0b30, eva=0)
61:    at /usr/src/sys/i386/i386/trap.c:821
62:#7  0xc07202b3 in trap (frame=
63:      {tf_fs = -1065484264, tf_es = -1065484272, tf_ds = -1065484272, tf_edi = 1, tf_esi = 0, tf_ebp = -602076292, tf_isp = -602076324, tf_ebx = 0, tf_edx = 0, tf_ecx = 1000000, tf_eax = 243, tf_trapno = 12, tf_err = 0, tf_eip = -1066321824, tf_cs = 8, tf_eflags = 65671, tf_esp = 243, tf_ss = 0})
64:    at /usr/src/sys/i386/i386/trap.c:250
65:#8  0xc070c9f8 in calltrap () at {standard input}:94
66:#9  0xc07139f3 in lapic_ipi_vectored (vector=0, dest=0)
67:    at /usr/src/sys/i386/i386/local_apic.c:733
68:#10 0xc0718b23 in ipi_selected (cpus=1, ipi=1)
69:    at /usr/src/sys/i386/i386/mp_machdep.c:1115
70:#11 0xc057473e in kseq_notify (ke=0xcc05e360, cpu=0)
71:    at /usr/src/sys/kern/sched_ule.c:520
72:#12 0xc0575cad in sched_add (td=0xcbcf5c80)
73:    at /usr/src/sys/kern/sched_ule.c:1366
74:#13 0xc05666c6 in setrunqueue (td=0xcc05e360)
75:    at /usr/src/sys/kern/kern_switch.c:422
76:#14 0xc05752f4 in sched_wakeup (td=0xcbcf5c80)
77:    at /usr/src/sys/kern/sched_ule.c:999
78:#15 0xc056816c in setrunnable (td=0xcbcf5c80)
79:    at /usr/src/sys/kern/kern_synch.c:570
80:#16 0xc0567d53 in wakeup (ident=0xcbcf5c80)
81:    at /usr/src/sys/kern/kern_synch.c:411
82:#17 0xc05490a8 in exit1 (td=0xcbcf5b40, rv=0)
83:    at /usr/src/sys/kern/kern_exit.c:509
84:#18 0xc0548011 in sys_exit () at /usr/src/sys/kern/kern_exit.c:102
85:#19 0xc0720fd0 in syscall (frame=
86:      {tf_fs = 47, tf_es = 47, tf_ds = 47, tf_edi = 0, tf_esi = -1, tf_ebp = -1077940712, tf_isp = -602075788, tf_ebx = 672411944, tf_edx = 10, tf_ecx = 672411600, tf_eax = 1, tf_trapno = 12, tf_err = 2, tf_eip = 671899563, tf_cs = 31, tf_eflags = 642, tf_esp = -1077940740, tf_ss = 47})
87:    at /usr/src/sys/i386/i386/trap.c:1010
88:#20 0xc070ca4d in Xint0x80_syscall () at {standard input}:136
89:---Can't read userspace from dump, or kernel process---
90:(kgdb) quit

技巧
如果你的系统经常崩溃并且磁盘空间不足，删除 /var/crash 中的旧 vmcore 文件可以节省相当多的磁盘空间！

10.3. 使用 DDB 进行在线内核调试

虽然 kgdb 作为离线调试器提供了非常高级的用户界面，但它有一些无法完成的任务。最重要的两个是设置断点和单步执行内核代码。

如果你需要对内核进行低级调试，可以使用一个在线调试器 DDB。它允许设置断点、单步执行内核函数、检查和修改内核变量等。然而，它无法访问内核源文件，且只能访问全局和静态符号，而不像 kgdb 那样拥有完整的调试信息。

要配置内核以包含 DDB，请在配置文件中添加以下选项：

options KDB

options DDB

待 DDB 内核启动运行，你可以通过多种方式进入 DDB。首先，最早的方式是使用启动标志 -d。这样，内核将在调试模式下启动，并在任何设备探测之前进入 DDB。因此，你甚至可以调试设备探测/附加函数。要使用此方法，请退出加载器的启动菜单并在加载器提示符下输入 boot -d。

第二种方式是在系统启动后进入调试器。有两种简单的方法可以实现这一点。如果你希望从命令提示符进入调试器，只需键入以下命令：

# sysctl debug.kdb.enter=1

或者，如果你在系统控制台上，可以使用键盘上的热键。默认的断点调试器快捷键是 Ctrl+Alt+ESC。对于 syscons，可以重新映射此快捷键，且一些分发的映射已经这样做，所以确保你知道正确的快捷键序列。如果你使用串行控制台，则可以通过串行线路上的 BREAK 信号进入 DDB（在内核配置文件中使用 options BREAK_TO_DEBUGGER）。这不是默认设置，因为很多串行适配器会无故生成 BREAK 信号，例如拔掉电缆时。

第三种方式是任何 panic 条件都会跳转到 DDB，如果内核已配置为使用它。因此，为无人值守的机器配置带有 DDB 的内核并不明智。

为了获得无人值守功能，可以在内核配置文件中添加：

options KDB_UNATTENDED

然后重新构建/重新安装内核。

DDB 的命令大致类似于一些 gdb 命令。你可能首先需要做的是设置断点：

break function-name address

数字默认为十六进制，但为了与符号名称区分开来，十六进制数字中以字母 a-f 开头的需要前面加 0x（其他数字则不需要）。简单的表达式也可以，例如：function-name + 0x103。

要退出调试器并继续执行，输入：

continue

要获取当前线程的堆栈跟踪，使用：

trace

要获取任意线程的堆栈跟踪，可以将进程 ID 或线程 ID 作为第二个参数传递给 trace。

如果要删除一个断点，使用：

del
 del address-expression

第一个形式会在断点命中后立即接受并删除当前断点。第二个形式可以删除任何断点，但需要指定确切的地址；可以通过以下命令获取该地址：

show b

或：

show break

要单步执行内核，可以尝试：

这会进入函数，但你可以让 DDB 跟踪这些函数，直到匹配的返回语句被达到，使用：

注意
这与 gdb 的 next 语句不同；它类似于 gdb 的 finish。多次按下 n 将导致继续执行。

要检查内存中的数据，可以使用（例如）：

x/wx 0xf0133fe0,40
 x/hd db_symtab_space
 x/bc termbuf,10
 x/s stringbuf

用于字/半字/字节访问，以及十六进制/十进制/字符/字符串显示。逗号后的数字是对象的数量。要显示接下来的 0x10 项，只需使用：

x ,10

类似地，使用

x/ia foofunc,10

来反汇编 foofunc 的前 0x10 条指令，并显示它们及其相对于 foofunc 开始位置的偏移。

要修改内存，使用写入命令：

w/b termbuf 0xa 0xb 0
 w/w 0xf0010030 0 0

命令修饰符（b/h/w）指定要写入的数据大小，第一个跟随的表达式是写入地址，剩下的被解释为写入到连续内存位置的数据。

如果需要查看当前的寄存器，可以使用：

show reg

或者，你可以通过例如以下命令显示单个寄存器的值：

p $eax

并通过以下命令修改它：

set $eax new-value

如果需要从 DDB 调用一些内核函数，只需输入：

call func(arg1, arg2, ...)

返回值将被打印出来。

ps

现在，你已经检查了内核崩溃的原因，想要重启系统。记住，根据先前故障的严重程度，并非所有内核部分仍然按预期工作。执行以下操作之一来关闭并重启系统：

panic

call boot(0)

可能是一个干净地关闭系统、sync() 所有磁盘并在某些情况下重启的好方法。只要内核的磁盘和文件系统接口没有损坏，这可能是一个几乎干净的关闭方式。

reset

这是灾难的最后逃生方式，几乎等同于按下大红按钮。

如果需要简短的命令总结，只需输入：

help

10.4. 在线内核调试使用远程 GDB

GDB 长期以来一直支持 远程调试。这通过一个非常简单的协议沿着串行线进行。与上述其他调试方法不同，使用远程 GDB 需要两台机器。一台是提供调试环境的主机，包括所有源代码和带有所有符号的内核二进制文件。另一台是运行相同内核副本的目标机器（可以选择剥离调试信息）。

为了使用远程 GDB，请确保在内核配置中包含以下选项：

makeoptions     DEBUG=-g
options         KDB
options         GDB

请注意，GDB 选项在 -STABLE 和 -RELEASE 分支的 GENERIC 内核中默认关闭，但在 -CURRENT 中已启用。

目标机器必须进入 GDB 后端，可以是由于 panic 或者通过故意触发进入调试器。在执行此操作之前，选择 GDB 调试后端：

# sysctl debug.kdb.current=gdb
debug.kdb.current: ddb -> gdb

注意

然后，强制进入调试器：

# sysctl debug.kdb.enter=1
debug.kdb.enter: 0KDB: enter: sysctl debug.kdb.enter

目标机器现在等待来自远程 GDB 客户端的连接。在调试机器上，进入目标内核的编译目录，并启动 gdb：

# cd /usr/obj/usr/src/amd64.amd64/sys/GENERIC/
# kgdb kernel
GNU gdb (GDB) 10.2 [GDB v10.2 for FreeBSD]
Copyright (C) 2021 Free Software Foundation, Inc.
...
Reading symbols from kernel...
Reading symbols from /usr/obj/usr/src/amd64.amd64/sys/GENERIC/kernel.debug...
(kgdb)

通过以下命令初始化远程调试会话（假设使用的是第一个串口）：

(kgdb) target remote /dev/cuau0

现在，主机 GDB 将控制目标内核：

Remote debugging using /dev/cuau0
kdb_enter (why=<optimized out>, msg=<optimized out>) at /usr/src/sys/kern/subr_kdb.c:506
506                     kdb_why = KDB_WHY_UNSET;
(kgdb)

技巧

您可以像使用任何其他 GDB 会话一样使用此会话，包括完全访问源代码，在 Emacs 窗口中以 gud-mode 运行它（这会在另一个 Emacs 窗口中自动显示源代码）等。

10.5. 调试控制台驱动程序

由于需要一个控制台驱动程序才能运行 DDB，如果控制台驱动程序本身出现故障，事情会变得更加复杂。您可能还记得使用串行控制台（通过修改启动块，或在 Boot: 提示符下指定 -h），并将标准终端连接到您的第一个串行端口。DDB 在任何配置了的控制台驱动程序上都能工作，包括串行控制台。

10.6. 调试死锁

如果可能，考虑进行进一步调查。如果您怀疑死锁发生在 VFS 层，下面的步骤尤其有用。请将这些选项添加到内核配置文件中。

makeoptions 	DEBUG=-g
options 	INVARIANTS
options 	INVARIANT_SUPPORT
options 	WITNESS
options 	WITNESS_SKIPSPIN
options 	DEBUG_LOCKS
options 	DEBUG_VFS_LOCKS
options 	DIAGNOSTIC

当死锁发生时，除了 ps 命令的输出外，还应提供来自 show pcpu、show allpcpu、show locks、show alllocks、show lockedvnods 和 alltrace 的信息。

为了获得线程进程的有意义的回溯，可以使用 thread thread-id 切换到线程栈，然后使用 where 进行回溯。

10.7. 使用 Dcons 进行内核调试

10.7.1. 通过 FireWire® 使用 Dcons

FireWire® 设备不限于集成在主板中的设备。桌面电脑可以使用 PCI 卡，笔记本电脑可以购买卡总线接口。

10.7.1.1. 在目标机器上启用 FireWire® 和 Dcons 支持

要在目标机器的内核中启用 FireWire® 和 Dcons 支持：

确保您的内核支持 dcons、dcons_crom 和 firewire。Dcons 应该与内核静态链接。对于 dcons_crom 和 firewire，模块应该是可以的。
确保启用了物理 DMA。您可能需要在 /boot/loader.conf 中添加 hw.firewire.phydma_enable=1。
添加调试选项。
如果使用 GDB 通过 FireWire® 调试，请在 /boot/loader.conf 中添加 dcons_gdb=1。
在 /etc/ttys 中启用 dcons。
可选地，要强制将 dcons 设置为高级控制台，请在 loader.conf 中添加 hw.firewire.dcons_crom.force_console=1。

# cd /sys/boot/i386 && make clean && make && make install

以下是一些配置示例。一个示例内核配置文件应该包含：

device dcons
device dcons_crom
options KDB
options DDB
options GDB
options ALT_BREAK_TO_DEBUGGER

示例 /boot/loader.conf 文件应包含：

dcons_crom_load="YES"
dcons_gdb=1
boot_multicons="YES"
hw.firewire.phydma_enable=1
hw.firewire.dcons_crom.force_console=1

10.7.1.2. 在主机机器上启用 FireWire® 和 Dcons 支持

要在主机机器的内核中启用 FireWire® 支持：

# kldload firewire

# dconschat -e \# -br -G 12345 -t 00-11-22-33-44-55-66-77

~+.

断开连接

ALT BREAK

重置目标

暂停 dconschat

kgdb -r :12345 kernel

10.7.1.3. 一些常规提示

以下是一些常规提示：

为了充分利用 FireWire® 的速度，禁用其他较慢的控制台驱动程序：

# conscontrol delete ttyd0	     # 串口控制台
# conscontrol delete consolectl	# 视频/键盘

(setq gud-gdba-command-name "kgdb -a -a -a -r :12345")
(setq gdb-many-windows t)
(xterm-mouse-mode 1)
M-x gdba

对于 DDD (devel/ddd)，您可以使用以下命令：

# 远程串行协议
LANG=C ddd --debugger kgdb -r :12345 kernel
# 实时核心调试
LANG=C ddd --debugger kgdb kernel /dev/fwmem0.2

10.7.2. 与 KVM 一起使用 Dcons

10.7.2.1. 使用 Dcons 与 KVM

# dconschat -1

# dconschat -1 -M vmcore.XX

可以通过以下方式进行实时核心调试：

# fwcontrol -m target_eui64
# kgdb kernel /dev/fwmem0.2

10.8. 内核调试选项词汇表

本节提供了用于调试的编译时内核选项的简要词汇表：

options KDB：编译内核调试器框架。options DDB 和 options GDB 需要此选项。几乎没有性能开销。默认情况下，当系统发生 panic 时，调试器会被触发，而不是自动重启。
options KDB_UNATTENDED：将 debug.debugger_on_panic sysctl 的默认值更改为 0，该 sysctl 控制系统在 panic 时是否进入调试器。如果内核中未编译 options KDB，则默认行为是在 panic 时自动重启；如果编译了 options KDB，默认行为是在没有编译 options KDB_UNATTENDED 的情况下进入调试器。如果希望将内核调试器保留在内核中，但希望系统在不进行诊断时能够恢复，除非您能使用调试器，使用此选项。
options KDB_TRACE：将 debug.trace_on_panic sysctl 的默认值更改为 1，该 sysctl 控制是否在 panic 时自动打印堆栈跟踪。尤其是在运行 options KDB_UNATTENDED 时，这对于在串行或 FireWire 控制台上收集基本调试信息非常有帮助，同时仍然能进行重启恢复。
options DDB：编译支持控制台调试器 DDB。此交互式调试器可以在系统的任何活动低级控制台上运行，包括视频控制台、串行控制台或 FireWire 控制台。它提供基本的集成调试功能，如堆栈跟踪、进程和线程列表、锁状态转储、虚拟内存状态、文件系统状态和内核内存管理。DDB 不需要在第二台机器上运行软件，也不需要生成核心转储或完整的调试内核符号，提供实时的内核诊断。许多错误可以仅通过 DDB 输出完全诊断。此选项依赖于 options KDB。
options GDB：编译支持远程调试器 GDB，可以通过串行电缆或 FireWire 进行操作。当调试器被触发时，可以附加 GDB 来检查结构内容、生成堆栈跟踪等。某些内核状态比在 DDB 中更难访问，因为 DDB 可以自动生成有用的内核状态摘要，如自动遍历锁调试或内核内存管理结构，而 GDB 需要在第二台机器上运行。另一方面，GDB 结合了内核源代码和完整的调试符号，并且能够了解完整的数据结构定义、局部变量，且可以编写脚本。此选项不要求在内核核心转储上运行 GDB。此选项依赖于 options KDB。
options BREAK_TO_DEBUGGER，options ALT_BREAK_TO_DEBUGGER：允许在控制台上使用中断信号或替代信号进入调试器。如果系统在没有 panic 的情况下挂起，这是进入调试器的一种有用方法。由于当前内核锁定的原因，通过串行控制台生成的中断信号在进入调试器时更为可靠，因此通常推荐使用这种方式。此选项对性能的影响很小或没有影响。
options INVARIANTS：将大量运行时断言检查和测试编译到内核中，这些检查和测试不断验证内核数据结构的完整性和内核算法的不变性。由于这些测试可能会比较耗费资源，因此默认情况下不编译，但它们有助于提供有用的“故障停止”行为，在内核数据损坏发生之前，某些类别的非预期行为会先进入调试器，使其更容易调试。这些测试包括内存擦洗和使用后释放的测试，这是影响性能的一个重要因素。此选项依赖于 options INVARIANT_SUPPORT。
options INVARIANT_SUPPORT：options INVARIANTS 中的许多测试需要修改的数据结构或需要定义额外的内核符号。
options WITNESS_SKIPSPIN：禁用 WITNESS 的自旋锁顺序检查。由于调度器中最常频繁地获取自旋锁，并且调度事件频繁发生，此选项可以显著加快运行 WITNESS 的系统。此选项依赖于 options WITNESS。
options WITNESS_KDB：将 debug.witness.kdb sysctl 的默认值更改为 1，这会使 WITNESS 在检测到锁定顺序违规时进入调试器，而不仅仅是打印警告。此选项依赖于 options WITNESS。
options SOCKBUF_DEBUG：对套接字缓冲区执行广泛的运行时一致性检查，这对于调试套接字错误和协议以及与套接字交互的设备驱动中的竞争条件非常有用。此选项对网络性能有显著影响，可能会改变设备驱动中的时序。
options DEBUG_VFS_LOCKS：跟踪 lockmgr/vnode 锁的锁定获取点，扩展 DDB 中 show lockedvnods 显示的内容。此选项对性能有可测量的影响。
options DIAGNOSTIC：启用附加的、较为昂贵的诊断测试，类似于 options INVARIANTS。

第 11 章 x86 汇编语言程序设计

A.1. 概述

在 UNIX® 下进行汇编语言编程的文献资料非常有限。通常认为没有人会使用汇编语言，因为各种 UNIX® 系统运行在不同的微处理器上，所以一切应该使用 C 语言编写以保证可移植性。

实际上，C 语言的可移植性实际上是个神话。无论它们运行在哪种处理器上，即使是 C 程序在从一款 UNIX® 移植到另一款 UNIX® 时，也需要修改。通常，这样的程序充满了依赖于其编译系统的条件语句。

即使我们相信所有 UNIX® 软件都应该使用 C 或其他高级语言编写，我们仍然需要汇编语言程序员：谁来编写访问内核的 C 库部分呢？

在本章中，我将尝试向您展示如何使用汇编语言编写 UNIX® 程序，特别是在 FreeBSD 下。

A.2. 工具

A.2.1. 汇编器

进行汇编语言编程最重要的工具是汇编器，它是将汇编语言代码转换为机器语言的软件。

本章使用 nasm 语法，因为大多数从其他操作系统转到 FreeBSD 的汇编语言程序员会觉得这种语法更易理解。而且，坦率地说，这也是我习惯的语法。

A.2.2. 链接器

汇编器的输出文件与任何编译器的输出文件一样，需要通过链接器来生成可执行文件。

FreeBSD 提供了标准的 ld(1) 链接器。它可以与任何汇编器生成的代码一起使用。

A.3. 系统调用

A.3.1. 默认调用约定

默认情况下，FreeBSD 内核使用 C 调用约定。此外，虽然内核是通过 int 80h 进行访问的，但程序会调用一个发出 int 80h 的函数，而不是直接发出 int 80h。

这种约定非常方便，并且比 MS-DOS® 使用的 Microsoft® 调用约定更为优越。为什么？因为 UNIX® 约定允许任何用任何语言编写的程序访问内核。

汇编语言程序也可以这样做。例如，我们可以打开一个文件：

kernel:
	int	80h	; 调用内核
	ret

open:
	push	dword mode
	push	dword flags
	push	dword path
	mov	eax, 5
	call	kernel
	add	esp, byte 12
	ret

这是非常简洁和可移植的编码方式。如果您需要将代码移植到使用不同中断或不同传递参数方式的 UNIX® 系统，只需要修改内核程序即可。

但汇编语言程序员通常喜欢优化性能。上面的例子需要 call/ret 组合。我们可以通过 push 一个额外的 dword 来消除它：

open:
	push	dword mode
	push	dword flags
	push	dword path
	mov	eax, 5
	push	eax		; 或任何其他 dword
	int	80h
	add	esp, byte 16

我们将 5 放入 EAX 寄存器中，以标识内核函数，此处为 open。

A.3.2. 替代调用约定

FreeBSD 是一款非常灵活的系统。它提供了其他访问内核的方式。然而，系统必须安装 Linux 模拟才能正常工作。

Linux 是一款类 UNIX® 系统。然而，它的内核使用与 MS-DOS® 相同的系统调用约定，即通过寄存器传递参数。与 UNIX® 约定类似，函数编号放在 EAX 中，参数则不通过堆栈传递，而是放在 EBX、ECX、EDX、ESI、EDI 和 EBP 中：

open:
	mov	eax, 5
	mov	ebx, path
	mov	ecx, flags
	mov	edx, mode
	int	80h

这种约定相对于 UNIX® 方式有一个很大的缺点，至少对汇编语言编程来说：每次进行内核调用时，您必须 push 寄存器，然后稍后再 pop 它们。这使得代码更庞大且运行较慢。尽管如此，FreeBSD 仍然提供了选择权。

如果您选择了 Linux 调用约定，您必须告诉系统。程序汇编并链接后，您需要为可执行文件打上品牌：

% brandelf -t Linux filename

A.3.3. 您应该使用哪种约定？

如果您专门为 FreeBSD 编程，您应该始终使用 UNIX® 约定：它更快，您可以将全局变量存储在寄存器中，不需要对可执行文件进行品牌化，也不需要在目标系统上安装 Linux 模拟包。

如果您希望创建可以在 Linux 上运行的可移植代码，您可能仍然希望为 FreeBSD 用户提供尽可能高效的代码。我将在解释基本内容之后，向您展示如何实现这一点。

A.3.4. 调用号

要告诉内核您正在调用哪个系统服务，请将其编号放入 EAX 中。当然，您需要知道这个编号是什么。

A.3.4.1. syscalls 文件

这些编号列在 syscalls 文件中。使用 locate syscalls 可以找到这个文件的多个不同格式，所有格式都从 syscalls.master 自动生成。

您可以在 /usr/src/sys/kern/syscalls.master 中找到默认 UNIX® 调用约定的主文件。如果您需要使用 Linux 模拟模式中实现的另一种约定，请阅读 /usr/src/sys/i386/linux/syscalls.master。

注意
不仅 FreeBSD 和 Linux 使用不同的调用约定，它们有时对相同的功能使用不同的编号。

syscalls.master 描述了如何进行调用：

0	STD	NOHIDE	{ int nosys(void); } syscall nosys_args int
1	STD	NOHIDE	{ void exit(int rval); } exit rexit_args void
2	STD	POSIX	{ int fork(void); }
3	STD	POSIX	{ ssize_t read(int fd, void *buf, size_t nbyte); }
4	STD	POSIX	{ ssize_t write(int fd, const void *buf, size_t nbyte); }
5	STD	POSIX	{ int open(char *path, int flags, int mode); }
6	STD	POSIX	{ int close(int fd); }
etc...

最左边的列告诉我们将哪个数字放入 EAX。

最右边的列告诉我们需要 push 什么参数。它们是从右到左依次 push 的。

例如，要 open 一个文件，我们需要首先 push mode，然后是 flags，最后是存储 path 地址的变量。

A.4. 返回值

如果系统调用没有返回某种类型的值，大多数情况下是没有用的：例如打开文件的文件描述符、读取到缓冲区的字节数、系统时间等。

此外，系统还需要告知我们是否发生了错误：例如文件不存在、系统资源耗尽、传递了无效参数等。

A.4.1. 手册页

在 UNIX® 系统下，传统的查看各种系统调用信息的地方是手册页。FreeBSD 在第 2 节中描述其系统调用，有时在第 3 节中。

如果成功，open() 返回一个非负整数，称为文件描述符。如果失败，返回 -1，并设置 errno 来指示错误。

对于刚接触 UNIX® 和 FreeBSD 的汇编语言程序员来说，立刻会产生一个令人困惑的问题：errno 到底在哪里，如何访问它？

注意
手册页中提供的信息适用于 C 程序。汇编语言程序员需要额外的信息。

A.4.2. 返回值在哪里？

不幸的是，这取决于……对于大多数系统调用，返回值在 EAX 中，但并非所有系统调用都如此。一个好的经验法则是，当首次处理一个系统调用时，先检查返回值是否在 EAX 中。如果不在那儿，您需要进一步的研究。

注意
我知道有一个系统调用将值返回在 EDX 中：SYS_fork。其他我处理过的系统调用都使用 EAX。但我还没有处理所有系统调用。

技巧
如果您在这里找不到答案或其他地方没有答案，可以研究 libc 源代码，看看它是如何与内核交互的。

A.4.3. `errno` 在哪里？

实际上，errno 根本不存在……

errno 是 C 语言的一部分，而不是 UNIX® 内核的一部分。当直接访问内核服务时，错误代码会返回到 EAX 中，这与通常存放返回值的寄存器相同。

这完全合理。如果没有错误，就没有错误代码。如果发生了错误，就没有返回值。一个寄存器可以同时存放这两者。

A.4.4. 如何判断是否发生了错误

在使用标准 FreeBSD 调用约定时，成功时 carry flag 会被清除，失败时会被设置。

在使用 Linux 模拟模式时，EAX 中的有符号值在成功时为非负值，并包含返回值。如果发生错误，值为负数，即 -errno。

A.5. 创建可移植代码

可移植性通常不是汇编语言的强项。然而，编写适用于不同平台的汇编语言程序是可能的，尤其是使用 nasm。我已经编写了可以在多个操作系统（如 Windows® 和 FreeBSD）上汇编的汇编语言库。

当您希望代码能够在两个不同平台上运行时，这尤其可行，这两个平台尽管有所不同，但基于类似的架构。

例如，FreeBSD 是 UNIX®，Linux 是 UNIX® 类似的操作系统。我只提到了它们之间的三个区别（从汇编语言程序员的角度看）：调用约定、函数号和返回值的方式。

A.5.1. 处理函数号

在许多情况下，函数号是相同的。然而，即使它们不相同，问题也很容易处理：不要在代码中直接使用数字，而是使用常量，根据目标架构不同进行定义：

%ifdef	LINUX
%define	SYS_execve	11
%else
%define	SYS_execve	59
%endif

A.5.2. 处理约定

调用约定和返回值（errno 问题）都可以通过宏来解决：

%ifdef	LINUX

%macro	system	0
	call	kernel
%endmacro

align 4
kernel:
	push	ebx
	push	ecx
	push	edx
	push	esi
	push	edi
	push	ebp

	mov	ebx, [esp+32]
	mov	ecx, [esp+36]
	mov	edx, [esp+40]
	mov	esi, [esp+44]
	mov	ebp, [esp+48]
	int	80h

	pop	ebp
	pop	edi
	pop	esi
	pop	edx
	pop	ecx
	pop	ebx

	or	eax, eax
	js	.errno
	clc
	ret

.errno:
	neg	eax
	stc
	ret

%else

%macro	system	0
	int	80h
%endmacro

%endif

A.5.3. 处理其他可移植性问题

上述解决方案可以处理大部分在 FreeBSD 和 Linux 之间编写可移植代码的情况。然而，对于某些内核服务，差异更为深入。

在这种情况下，您需要为那些特定的系统调用编写两个不同的处理程序，并使用条件汇编。幸运的是，您的大部分代码做的工作与调用内核无关，因此通常您只需要在代码中添加几个这样的条件部分。

A.5.4. 使用库

您可以通过编写一个系统调用库，完全避免主代码中的可移植性问题。为 FreeBSD 编写一个单独的库，为 Linux 编写另一个不同的库，甚至为更多操作系统编写其他库。

在您的库中，为每个系统调用编写一个单独的函数（或者，如果您喜欢传统的汇编语言术语，可以称之为过程）。使用 C 调用约定来传递参数，但仍然使用 EAX 来传递调用号。在这种情况下，您的 FreeBSD 库可以非常简单，因为许多看似不同的函数实际上只是指向相同代码的标签：

sys.open:
sys.close:
[等等...]
	int	80h
	ret

您的 Linux 库将需要更多不同的函数。但是即便如此，您也可以根据相同的参数数量来分组系统调用：

sys.exit:
sys.close:
[等等... 单参数函数]
	push	ebx
	mov	ebx, [esp+12]
	int	80h
	pop	ebx
	jmp	sys.return

...

sys.return:
	or	eax, eax
	js	sys.err
	clc
	ret

sys.err:
	neg	eax
	stc
	ret

最初，使用库的方法可能看起来不方便，因为它需要您生成一个代码依赖的单独文件。但它有许多优点：首先，您只需要编写一次，并且可以将其用于所有程序。您甚至可以让其他汇编语言程序员使用它，或者使用由他人编写的库。但或许库的最大优势是，您的代码可以通过简单编写一个新的库而无需更改代码，即可移植到其他系统，甚至其他程序员也能完成此操作。

如果您不喜欢使用库的想法，您至少可以将所有系统调用放在一个单独的汇编语言文件中，并将其与主程序链接。在这种情况下，移植者只需要创建一个新的目标文件来与主程序链接。

A.5.5. 使用包含文件

如果您将软件作为（或与）源代码一起发布，您可以使用宏并将它们放在一个单独的文件中，然后在代码中包含这个文件。

您的软件移植者只需编写一个新的包含文件。这样就不需要库或外部目标文件，但您的代码依然可以在无需编辑代码的情况下实现可移植性。

注意
这是我们将在本章中使用的方法。我们将把包含文件命名为 system.inc，并在处理新的系统调用时不断添加内容。

我们可以通过声明标准的文件描述符来开始我们的 system.inc：

%define	stdin	0
%define	stdout	1
%define	stderr	2

接下来，为每个系统调用创建一个符号名称：

%define	SYS_nosys	0
%define	SYS_exit	1
%define	SYS_fork	2
%define	SYS_read	3
%define	SYS_write	4
; [等等...]

我们添加一个短小、非全局的过程，命名为长名称，这样我们就不会在代码中不小心重复使用它：

section	.text
align 4
access.the.bsd.kernel:
	int	80h
	ret

然后，我们创建一个宏，它接收一个参数，即系统调用编号：

%macro	system	1
	mov	eax, %1
	call	access.the.bsd.kernel
%endmacro

最后，我们为每个系统调用创建宏，这些宏不接受任何参数。

%macro	sys.exit	0
	system	SYS_exit
%endmacro

%macro	sys.fork	0
	system	SYS_fork
%endmacro

%macro	sys.read	0
	system	SYS_read
%endmacro

%macro	sys.write	0
	system	SYS_write
%endmacro

; [等等...]

接下来，输入并保存它为 system.inc。随着我们讨论更多的系统调用，内容还将继续添加到其中。

A.6. 我们的第一个程序

现在，我们准备好编写第一个程序——必备的“Hello, World!”程序。

%include	'system.inc'

	section	.data
	hello	db	'Hello, World!', 0Ah
	hbytes	equ	$-hello

	section	.text
	global	_start
_start:
	push	dword hbytes
	push	dword hello
	push	dword stdout
	sys.write

	push	dword 0
	sys.exit

这段代码的功能如下：第一行包含了 system.inc 中的定义、宏和代码。

第3-5行是数据部分：第3行开始了数据段。第4行包含了字符串“Hello, World!”以及一个换行符 (0Ah)。第5行创建了一个常量，表示第4行字符串的字节长度。

第7-16行是代码部分。需要注意的是，FreeBSD 使用 elf 文件格式来处理其可执行文件，这要求每个程序都从标签 _start 开始（更准确地说，链接器期望这样做）。该标签必须是全局的。

第10-13行请求系统将 hbytes 字节的 hello 字符串写入 stdout。

第15-16行请求系统用返回值 0 结束程序。由于 SYS_exit 系统调用不会返回，因此代码在此结束。

注意
如果你是从 MS-DOS® 汇编语言背景转到 UNIX®，你可能习惯了直接写入视频硬件。在 FreeBSD 或任何其他 UNIX® 系统中，你不必担心这个问题。对你来说，你是在写入一个名为 stdout 的文件。这个文件可以是视频屏幕、telnet 终端、实际文件，甚至是另一个程序的输入。至于它是什么，交给系统来处理。

A.6.1. 汇编代码

将代码输入编辑器，并将其保存为 hello.asm 文件。你需要使用 nasm 来汇编它。

A.6.1.1. 安装 nasm

如果你没有安装 nasm，可以输入：

% su
Password:你的 root 密码
# cd /usr/ports/devel/nasm
# make install
# exit
%

如果你不想保留 nasm 源代码，可以输入 make install clean，而不是单纯的 make install。

无论哪种方式，FreeBSD 会自动从互联网上下载 nasm，进行编译，并安装到你的系统上。

注意

现在你可以汇编、链接并运行代码：

% nasm -f elf hello.asm
% ld -s -o hello hello.o
% ./hello
Hello, World!
%

A.7. 编写 UNIX® 过滤器

一种常见的 UNIX® 应用程序类型是过滤器——它是一个从 stdin 读取数据，进行某种处理，然后将结果写入 stdout 的程序。

在本章中，我们将开发一个简单的过滤器，学习如何从 stdin 读取数据并写入 stdout。这个过滤器将把输入的每个字节转换为一个十六进制数，并在后面加上一个空格。

%include	'system.inc'

section	.data
hex	db	'0123456789ABCDEF'
buffer	db	0, 0, ' '

section	.text
global	_start
_start:
	; 从 stdin 读取一个字节
	push	dword 1
	push	dword buffer
	push	dword stdin
	sys.read
	add	esp, byte 12
	or	eax, eax
	je	.done

	; 转换为十六进制
	movzx	eax, byte [buffer]
	mov	edx, eax
	shr	dl, 4
	mov	dl, [hex+edx]
	mov	[buffer], dl
	and	al, 0Fh
	mov	al, [hex+eax]
	mov	[buffer+1], al

	; 打印出来
	push	dword 3
	push	dword buffer
	push	dword stdout
	sys.write
	add	esp, byte 12
	jmp	short _start

.done:
	push	dword 0
	sys.exit

在数据部分，我们创建了一个名为 hex 的数组，包含了 16 个十六进制数字，按升序排列。数组后面是一个缓冲区，我们将用它来存储输入和输出。缓冲区的前两个字节最初设置为 0，用于存储两个十六进制数字（第一个字节同时用于读取输入）。第三个字节是一个空格。

代码部分包含了四个部分：读取字节、将其转换为十六进制、写入结果，以及最终退出程序。

为了读取字节，我们请求系统从 stdin 读取一个字节，并将其存储在 buffer 的第一个字节中。系统返回读取的字节数，存储在 EAX 中。当有数据时，它的值为 1，而当没有更多输入数据时，它的值为 0。因此，我们检查 EAX 的值。如果它为 0，则跳转到 .done，否则继续执行。

注意
为了简单起见，我们暂时忽略了错误条件。

十六进制转换部分将字节从 buffer 读入 EAX（实际上只读 AL），同时将 EAX 的其余位清零。我们还将字节复制到 EDX 中，因为我们需要分别处理高四位（nibble）和低四位。转换结果存储在缓冲区的前两个字节中。

接下来，我们请求系统将缓冲区的三个字节（即两个十六进制数字和空格）写入 stdout。然后，我们跳转回程序的开始，处理下一个字节。

一旦没有更多输入数据，我们请求系统退出程序，返回值为 0，这是表示程序成功的传统值。

接下来，保存代码为 hex.asm，然后输入以下命令（^D 代表按住控制键并同时按 D）：

% nasm -f elf hex.asm
% ld -s -o hex hex.o
% ./hex
Hello, World!
48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21 0A Here I come!
48 65 72 65 20 49 20 63 6F 6D 65 21 0A ^D %

注意
如果你是从 MS-DOS® 迁移到 UNIX®，你可能会好奇为什么每行以 0A 结尾，而不是 0D 0A。这是因为 UNIX® 不使用 CR/LF（回车/换行）约定，而是使用“新行”约定，该新行用十六进制 0A 表示。

我们能改进这个程序吗？首先，它有点混乱，因为一旦我们转换了一行文本，输入就不再从行首开始了。我们可以修改它，在每个 0A 后打印一个新行，而不是空格：

%include	'system.inc'

section	.data
hex	db	'0123456789ABCDEF'
buffer	db	0, 0, ' '

section	.text
global	_start
_start:
	mov	cl, ' '

.loop:
	; 从 stdin 读取一个字节
	push	dword 1
	push	dword buffer
	push	dword stdin
	sys.read
	add	esp, byte 12
	or	eax, eax
	je	.done

	; 转换为十六进制
	movzx	eax, byte [buffer]
	mov	[buffer+2], cl
	cmp	al, 0Ah
	jne	.hex
	mov	[buffer+2], al

.hex:
	mov	edx, eax
	shr	dl, 4
	mov	dl, [hex+edx]
	mov	[buffer], dl
	and	al, 0Fh
	mov	al, [hex+eax]
	mov	[buffer+1], al

	; 打印出来
	push	dword 3
	push	dword buffer
	push	dword stdout
	sys.write
	add	esp, byte 12
	jmp	short .loop

.done:
	push	dword 0
	sys.exit

我们将空格存储在 CL 寄存器中。我们这样做是安全的，因为与 Microsoft® Windows® 不同，UNIX® 系统调用不会修改它们没有使用来返回值的寄存器。

这意味着我们只需设置一次 CL 寄存器。因此，我们添加了一个新的标签 .loop，并跳转到它以处理下一个字节，而不是跳转到 _start。我们还添加了 .hex 标签，这样我们就可以在 buffer 的第三个字节中放置一个空格或一个新行。

修改 hex.asm 后，再次执行：

% nasm -f elf hex.asm
% ld -s -o hex hex.o
% ./hex
Hello, World!
48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21 0A
Here I come!
48 65 72 65 20 49 20 63 6F 6D 65 21 0A
^D %

这看起来好多了。但这个程序效率不高！我们对每个字节都进行了两次系统调用（一次读取，另一次写入输出）。

A.8. 缓冲输入和输出

通过对输入和输出进行缓冲，我们可以提高代码的效率。我们创建一个输入缓冲区，一次读取一整段字节，然后逐个从缓冲区中获取这些字节。

我们还创建一个输出缓冲区。我们将输出存储在缓冲区中，直到它满了。这时，我们请求内核将缓冲区的内容写入 stdout。

程序在没有更多输入时结束。但我们仍然需要请求内核最后一次将输出缓冲区的内容写入 stdout，否则一些输出可能会被写入输出缓冲区，但永远不会被发送出去。不要忘记这一点，否则你会发现某些输出丢失了。

%include	'system.inc'

%define	BUFSIZE	2048

section	.data
hex	db	'0123456789ABCDEF'

section .bss
ibuffer	resb	BUFSIZE
obuffer	resb	BUFSIZE

section	.text
global	_start
_start:
	sub	eax, eax
	sub	ebx, ebx
	sub	ecx, ecx
	mov	edi, obuffer

.loop:
	; 从 stdin 读取一个字节
	call	getchar

	; 转换为十六进制
	mov	dl, al
	shr	al, 4
	mov	al, [hex+eax]
	call	putchar

	mov	al, dl
	and	al, 0Fh
	mov	al, [hex+eax]
	call	putchar

	mov	al, ' '
	cmp	dl, 0Ah
	jne	.put
	mov	al, dl

.put:
	call	putchar
	jmp	short .loop

align 4
getchar:
	or	ebx, ebx
	jne	.fetch

	call	read

.fetch:
	lodsb
	dec	ebx
	ret

read:
	push	dword BUFSIZE
	mov	esi, ibuffer
	push	esi
	push	dword stdin
	sys.read
	add	esp, byte 12
	mov	ebx, eax
	or	eax, eax
	je	.done
	sub	eax, eax
	ret

align 4
.done:
	call	write		; 刷新输出缓冲区
	push	dword 0
	sys.exit

align 4
putchar:
	stosb
	inc	ecx
	cmp	ecx, BUFSIZE
	je	write
	ret

align 4
write:
	sub	edi, ecx	; 缓冲区的开始
	push	ecx
	push	edi
	push	dword stdout
	sys.write
	add	esp, byte 12
	sub	eax, eax
	sub	ecx, ecx	; 缓冲区现在是空的
	ret

现在，我们的源代码中有了第三个部分，命名为 .bss。该部分不包含在可执行文件中，因此不能初始化。我们使用 resb 而不是 db，它仅为我们保留了请求的大小的未初始化内存。

我们利用了系统不会修改寄存器的特性：我们使用寄存器来存储本应作为全局变量存储在 .data 部分的值。这也是 UNIX® 在系统调用中通过栈传递参数的约定优于 Microsoft® 约定的原因：我们可以将寄存器保留给自己的使用。

我们使用 EDI 和 ESI 作为指向下一个要读取或写入字节的指针。我们使用 EBX 和 ECX 来保持两个缓冲区中字节的计数，以便知道何时将输出转储到系统中，或从系统中读取更多输入。

让我们看看现在它是如何工作的：

% nasm -f elf hex.asm
% ld -s -o hex hex.o
% ./hex
Hello, World!
Here I come!
48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21 0A
48 65 72 65 20 49 20 63 6F 6D 65 21 0A
^D %

不是你预期的结果吗？程序直到我们按下 ^D 后才打印输出。这很容易修复，只需插入三行代码，每次我们将一行转换为 0A 时就写入输出。我已用 > 标记了三行（不要在你的 hex.asm 中复制 >）。

%include	'system.inc'

%define	BUFSIZE	2048

section	.data
hex	db	'0123456789ABCDEF'

section .bss
ibuffer	resb	BUFSIZE
obuffer	resb	BUFSIZE

section	.text
global	_start
_start:
	sub	eax, eax
	sub	ebx, ebx
	sub	ecx, ecx
	mov	edi, obuffer

.loop:
	; read a byte from stdin
	call	getchar

	; convert it to hex
	mov	dl, al
	shr	al, 4
	mov	al, [hex+eax]
	call	putchar

	mov	al, dl
	and	al, 0Fh
	mov	al, [hex+eax]
	call	putchar

	mov	al, ' '
	cmp	dl, 0Ah
	jne	.put
	mov	al, dl

.put:
	call	putchar
>	cmp	al, 0Ah
>	jne	.loop
>	call	write
	jmp	short .loop

align 4
getchar:
	or	ebx, ebx
	jne	.fetch

	call	read

.fetch:
	lodsb
	dec	ebx
	ret

read:
	push	dword BUFSIZE
	mov	esi, ibuffer
	push	esi
	push	dword stdin
	sys.read
	add	esp, byte 12
	mov	ebx, eax
	or	eax, eax
	je	.done
	sub	eax, eax
	ret

align 4
.done:
	call	write		; flush output buffer
	push	dword 0
	sys.exit

align 4
putchar:
	stosb
	inc	ecx
	cmp	ecx, BUFSIZE
	je	write
	ret

align 4
write:
	sub	edi, ecx	; start of buffer
	push	ecx
	push	edi
	push	dword stdout
	sys.write
	add	esp, byte 12
	sub	eax, eax
	sub	ecx, ecx	; buffer is empty now
	ret

现在，让我们看看它是如何工作的：

% nasm -f elf hex.asm
% ld -s -o hex hex.o
% ./hex
Hello, World!
48 65 6C 6C 6F 2C 20 57 6F 72 6C 64 21 0A
Here I come!
48 65 72 65 20 49 20 63 6F 6D 65 21 0A
^D %

对于一个 644 字节的可执行文件，这还不错，对吧！

注意

A.8.1. 如何将字符重新放回输入流

警告

虽然我们的示例程序并不需要这个功能，但更复杂的过滤器通常需要进行前瞻处理。换句话说，它们可能需要查看下一个字符是什么（甚至是几个字符）。如果下一个字符是某个特定值，它就是当前正在处理的标记的一部分，否则就不是。

例如，在解析输入流中的文本字符串时（例如，编写语言编译器时）：如果一个字符后面跟着另一个字符，或者是一个数字，它就是正在处理的标记的一部分。如果后面跟着空白字符或其他值，那么它就不属于当前的标记。

这就引出了一个有趣的问题：如何将下一个字符放回输入流中，以便稍后可以再次读取？

一种可能的解决方案是将其存储在一个字符变量中，然后设置一个标志。我们可以修改 getchar，使其检查标志，如果标志被设置，就从该变量中获取字节，而不是从输入缓冲区读取，并重置标志。但是，当然，这会导致程序变慢。

C 语言有一个 ungetc() 函数，正是为此目的设计的。那么，我们在代码中有没有什么快速实现的方法呢？我建议你先回头看看 getchar 程序，看看你能否在读下一段之前找到一个简洁快速的解决方案。然后再回来看看我自己的解决方案。

将字符重新放回输入流的关键在于我们最初是如何获取字符的：

首先，我们通过检查 EBX 的值来确认缓冲区是否为空。如果为零，我们就调用 read 程序。

如果确实有字符可用，我们使用 lodsb，然后减少 EBX 的值。lodsb 指令实际上等同于：

mov	al, [esi]
	inc	esi

我们提取的字节将保留在缓冲区中，直到下一次调用 read。我们不知道何时会发生，但我们知道直到下一次调用 getchar 时，它才会发生。因此，要“返回”上次读取的字节，我们只需减少 ESI 的值并增加 EBX 的值：

ungetc:
	dec	esi
	inc	ebx
	ret

但是，注意！如果我们的前瞻只检查一个字符，这样做是完全安全的。如果我们检查多个即将到来的字符并连续多次调用 ungetc，它通常能正常工作，但并非每次都能成功（而且很难调试）。为什么呢？

因为只要 getchar 不需要调用 read，所有提前读取的字节仍然保存在缓冲区中，我们的 ungetc 就可以顺利工作。但是一旦 getchar 调用了 read，缓冲区的内容就会发生变化。

我们可以始终依赖 ungetc 正确工作在最后一个通过 getchar 读取的字符上，但不能依赖它处理之前读取的字符。

如果你的程序需要读取多个字节，你至少有两种选择：

如果可能，修改程序，使其只读取一个字节。这是最简单的解决方案。
如果无法选择此方案，首先确定程序一次需要返回输入流的最大字符数。稍微增加这个值，确保它足够大，最好是 16 的倍数——这样它就可以很好地对齐。然后修改代码的 .bss 部分，在输入缓冲区之前创建一个小的“备用”缓冲区，例如：

section	.bss
	resb	16	; 或者是你计算出来的值
ibuffer	resb	BUFSIZE
obuffer	resb	BUFSIZE

你还需要修改 ungetc，将要重新放回的字节值传递给 AL：

ungetc:
	dec	esi
	inc	ebx
	mov	[esi], al
	ret

通过这种修改，你可以安全地调用 ungetc 多达 17 次（第一次调用仍然在缓冲区内，剩余的 16 次可以在缓冲区内或在“备用”缓冲区内）。

A.9. 命令行参数

如果我们的 hex 程序能从命令行读取输入和输出文件的名称，那么它将变得更加有用，也就是说，它能处理命令行参数。但... 它们在哪里呢？

在 UNIX® 系统启动程序之前，它会将一些数据 push 到栈中，然后跳转到程序的 _start 标签。是的，我说的是跳转，而不是调用。这意味着这些数据可以通过读取 [esp+offset] 来访问，或者通过简单地 pop 它们来访问。

栈顶的值包含命令行参数的数量，通常称为 argc，即“参数计数”。

命令行参数紧随其后，所有 argc 个参数。通常这些被称为 argv，即“参数值”。也就是说，我们可以获取 argv[0]、argv[1]、…、argv[argc-1]。这些不是实际的参数，而是指向参数的指针，也就是实际参数的内存地址。参数本身是以 NUL 终止的字符字符串。

argv 列表后跟一个 NULL 指针，这只是一个 0。还有更多的内容，但目前为止，这些已经足够了。

注意
如果你来自 MS-DOS® 编程环境，主要的区别是每个参数都在一个独立的字符串中。第二个区别是对参数数量没有实际的限制。

掌握了这些知识后，我们几乎可以开始编写 hex.asm 的下一个版本了。不过，在此之前，我们需要向 system.inc 文件中添加几行内容：

首先，我们需要向系统调用号列表中添加两个新的条目：

%define	SYS_open	5
%define	SYS_close	6

接着，在文件末尾添加两个新的宏：

%macro	sys.open	0
	system	SYS_open
%endmacro

%macro	sys.close	0
	system	SYS_close
%endmacro

以下是我们修改后的源代码：

%include	'system.inc'

%define	BUFSIZE	2048	; 定义缓冲区大小为 2048 字节

section	.data
fd.in	dd	stdin	; 定义输入文件描述符（stdin）
fd.out	dd	stdout	; 定义输出文件描述符（stdout）
hex	db	'0123456789ABCDEF'	; 十六进制字符表

section .bss
ibuffer	resb	BUFSIZE	; 输入缓冲区
obuffer	resb	BUFSIZE	; 输出缓冲区

section	.text
align 4
err:
	push	dword 1		; 返回失败代码 1
	sys.exit			; 退出程序

align 4
global	_start
_start:
	add	esp, byte 8	; 丢弃 argc 和 argv[0]，即去掉命令行参数计数器和程序名

	pop	ecx
	jecxz	.init		; 如果没有更多的参数，跳到初始化部分

	; ECX 现在包含输入文件的路径
	push	dword 0		; O_RDONLY：以只读模式打开文件
	push	ecx			; 文件路径作为参数
	sys.open			; 系统调用打开文件
	jc	err				; 如果打开失败，跳到错误处理

	add	esp, byte 8	; 恢复堆栈
	mov	[fd.in], eax	; 保存输入文件描述符

	pop	ecx
	jecxz	.init		; 如果没有更多的参数，跳到初始化部分

	; ECX 现在包含输出文件的路径
	push	dword 420	; 文件权限（644 八进制）
	push	dword 0200h | 0400h | 01h	; O_CREAT | O_TRUNC | O_WRONLY
	; 创建输出文件，覆盖文件
	push	ecx			; 输出文件路径作为参数
	sys.open			; 系统调用打开文件
	jc	err				; 如果打开失败，跳到错误处理

	add	esp, byte 12	; 恢复堆栈
	mov	[fd.out], eax	; 保存输出文件描述符

.init:
	sub	eax, eax	; 清空寄存器
	sub	ebx, ebx	; 清空寄存器
	sub	ecx, ecx	; 清空寄存器
	mov	edi, obuffer	; 将输出缓冲区的地址移动到 EDI 寄存器

.loop:
	; 从输入文件或标准输入读取一个字节
	call	getchar

	; 将字节转换为十六进制格式
	mov	dl, al			; 保存原始字节到 dl
	shr	al, 4			; 将字节高四位移动到低四位
	mov	al, [hex+eax]	; 查找十六进制字符
	call	putchar		; 输出十六进制字符

	mov	al, dl			; 获取低四位
	and	al, 0Fh			; 清除高四位
	mov	al, [hex+eax]	; 查找低四位的十六进制字符
	call	putchar		; 输出低四位的十六进制字符

	mov	al, ' '			; 输出空格
	cmp	dl, 0Ah			; 如果是换行符
	jne	.put				; 如果不是换行符，跳到 put
	mov	al, dl			; 如果是换行符，输出换行符

.put:
	call	putchar		; 输出字符
	cmp	al, dl			; 比较字符是否已完全输出
	jne	.loop			; 如果未完成，继续循环
	call	write			; 写入缓冲区内容到输出
	jmp	short .loop		; 继续处理下一个字节

align 4
getchar:
	or	ebx, ebx			; 检查 EBX 是否为零
	jne	.fetch				; 如果非零，跳转到 fetch

	call	read				; 如果为零，调用 read 读取数据

.fetch:
	lodsb					; 加载字节并增加 ESI
	dec	ebx					; 减少 EBX（字节计数器）
	ret						; 返回

read:
	push	dword BUFSIZE		; 推入缓冲区大小
	mov	esi, ibuffer		; 设置输入缓冲区地址
	push	esi				; 参数：缓冲区地址
	push	dword [fd.in]		; 参数：输入文件描述符
	sys.read				; 系统调用读取文件
	add	esp, byte 12		; 恢复堆栈
	mov	ebx, eax			; 保存返回值（读取的字节数）
	or	eax, eax			; 检查返回值是否为零
	je	.done				; 如果没有读取到数据，跳到 done
	sub	eax, eax			; 重置 EAX
	ret						; 返回

align 4
.done:
	call	write				; 刷新输出缓冲区

	; 关闭文件
	push	dword [fd.in]		; 关闭输入文件描述符
	sys.close

	push	dword [fd.out]		; 关闭输出文件描述符
	sys.close

	; 返回成功
	push	dword 0			; 返回代码 0
	sys.exit				; 退出程序

align 4
putchar:
	stosb					; 将 AL 存储到输出缓冲区
	inc	ecx					; 增加缓冲区索引
	cmp	ecx, BUFSIZE		; 检查缓冲区是否已满
	je	write				; 如果满了，调用 write 写入
	ret						; 否则返回

align 4
write:
	sub	edi, ecx			; 计算缓冲区的起始地址
	push	ecx					; 推入缓冲区大小
	push	edi					; 推入缓冲区地址
	push	dword [fd.out]		; 推入输出文件描述符
	sys.write				; 系统调用写入文件
	add	esp, byte 12		; 恢复堆栈
	sub	eax, eax			; 清除 EAX
	sub	ecx, ecx			; 清空缓冲区
	ret						; 返回

在我们的 .data 部分，现在有了两个新变量，fd.in 和 fd.out。我们在这里存储输入和输出的文件描述符。

在 .text 部分，我们将对 stdin 和 stdout 的引用替换为 [fd.in] 和 [fd.out]。

.text 部分现在以一个简单的错误处理程序开始，它仅仅是退出程序并返回值 1。这个错误处理程序位于 _start 之前，因此我们可以很接近错误发生的地方。

自然，程序的执行仍然从 _start 开始。首先，我们从栈中移除 argc 和 argv[0]：它们对我们来说不重要（在这个程序中是这样）。

我们将 argv[1] 弹出到 ECX 寄存器。这个寄存器特别适合存储指针，因为我们可以通过 jecxz 来处理 NULL 指针。如果 argv[1] 不是 NULL，我们尝试打开第一个参数指定的文件。否则，我们继续像之前一样操作：从 stdin 读取，写入 stdout。如果我们无法打开输入文件（例如它不存在），我们跳转到错误处理程序并退出。

如果一切顺利，我们接着检查第二个参数。如果它存在，我们打开输出文件。否则，我们将输出发送到 stdout。如果我们无法打开输出文件（例如它存在但我们没有写入权限），我们再次跳转到错误处理程序。

其余的代码与之前相同，唯一不同的是我们在退出之前关闭输入和输出文件，并且，如前所述，我们使用 [fd.in] 和 [fd.out]。

我们的可执行文件现在已经达到 768 字节。

我们还能改进它吗？当然！每个程序都可以改进。以下是一些可以做的改进：

让我们的错误处理程序打印一条消息到 stderr。
为 read 和 write 函数添加错误处理程序。
当我们打开输入文件时关闭 stdin，当我们打开输出文件时关闭 stdout。
添加命令行开关，比如 -i 和 -o，这样我们就可以任意顺序列出输入和输出文件，或者从 stdin 读取并写入到文件。
如果命令行参数不正确，打印使用帮助信息。

我将把这些改进留给读者：你已经知道实现它们所需要了解的一切。

A.10. UNIX® 环境

UNIX® 中一个重要的概念是环境，它由 环境变量 定义。有些环境变量由系统设置，有些由你设置，还有一些由 shell 或任何加载其他程序的程序设置。

A.10.1. 如何查找环境变量

我之前提到，当程序开始执行时，栈中包含 argc 后跟一个以 NULL 结束的 argv 数组，接着还有其他内容。这个“其他内容”就是环境，更确切地说，是一个以 NULL 结束的指针数组，指向 环境变量。这通常被称为 env。

env 的结构与 argv 相同，是一系列内存地址后跟一个 NULL（0）。在这种情况下，没有 "envc" —— 我们通过查找最终的 NULL 来确定数组的结束。

这些变量通常以 name=value 格式出现，但有时 =value 部分可能缺失。我们需要考虑到这种可能性。

A.10.2. webvars

我本可以直接展示一些代码，像 UNIX® 的 env 命令那样打印环境变量。但我认为编写一个简单的汇编语言 CGI 工具会更有趣。

A.10.2.1. CGI：快速概述

Web 服务器通过设置 环境变量 与 CGI 程序通信。
CGI 程序将输出发送到 stdout。Web 服务器从那里读取输出。
它必须以 HTTP 头开始，后面跟着两个空行。
然后，它打印 HTML 代码或它正在生成的其他类型的数据。

注意
虽然某些 环境变量 使用标准名称，但其他变量会有所不同，具体取决于 Web 服务器。这使得 webvars 成为一个非常有用的诊断工具。

A.10.2.2. 代码

我们的 webvars 程序必须先发送 HTTP 头，接着是一些 HTML 标记。然后它必须逐个读取 环境变量 并将其作为 HTML 页面的一部分输出。

以下是代码。我在代码中直接插入了注释和解释：

;;;;;;; webvars.asm ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;
; Copyright (c) 2000 G. Adam Stanislav
; All rights reserved.
;
; Redistribution and use in source and binary forms, with or without
; modification, are permitted provided that the following conditions
; are met:
; 1. Redistributions of source code must retain the above copyright
;    notice, this list of conditions and the following disclaimer.
; 2. Redistributions in binary form must reproduce the above copyright
;    notice, this list of conditions and the following disclaimer in the
;    documentation and/or other materials provided with the distribution.
;
; THIS SOFTWARE IS PROVIDED BY THE AUTHOR AND CONTRIBUTORS ``AS IS'' AND
; ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
; IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
; ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR OR CONTRIBUTORS BE LIABLE
; FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
; DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
; OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
; HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
; LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
; OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
; SUCH DAMAGE.
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;
; Version 1.0
;
; Started:	 8-Dec-2000
; Updated:	 8-Dec-2000
;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
%include	'system.inc'

section	.data
http	db	'Content-type: text/html', 0Ah, 0Ah
	db	'<?xml version="1.0" encoding="utf-8"?>', 0Ah
	db	'<!DOCTYPE html PUBLIC "-//W3C/DTD XHTML Strict//EN" '
	db	'"DTD/xhtml1-strict.dtd">', 0Ah
	db	'<html xmlns="http://www.w3.org/1999/xhtml" '
	db	'xml.lang="en" lang="en">', 0Ah
	db	'<head>', 0Ah
	db	'<title>Web Environment</title>', 0Ah
	db	'<meta name="author" content="G. Adam Stanislav" />', 0Ah
	db	'</head>', 0Ah, 0Ah
	db	'<body bgcolor="#ffffff" text="#000000" link="#0000ff" '
	db	'vlink="#840084" alink="#0000ff">', 0Ah
	db	'<div class="webvars">', 0Ah
	db	'<h1>Web Environment</h1>', 0Ah
	db	'<p>The following <b>environment variables</b> are defined '
	db	'on this web server:</p>', 0Ah, 0Ah
	db	'<table align="center" width="80" border="0" cellpadding="10" '
	db	'cellspacing="0" class="webvars">', 0Ah
httplen	equ	$-http
left	db	'<tr>', 0Ah
	db	'<td class="name"><tt>'  ; 开始打印HTML表格的每一行（名称列）
leftlen	equ	$-left
middle	db	'</tt></td>', 0Ah
	db	'<td class="value"><tt><b>'  ; 在表格中加入值列
midlen	equ	$-middle
undef	db	'<i>(undefined)</i>'  ; 未定义的值
undeflen	equ	$-undef
right	db	'</b></tt></td>', 0Ah
	db	'</tr>', 0Ah  ; 表格结束的一行
rightlen	equ	$-right
wrap	db	'</table>', 0Ah
	db	'</div>', 0Ah
	db	'</body>', 0Ah
	db	'</html>', 0Ah, 0Ah  ; 完整的HTML结构结束
wraplen	equ	$-wrap

section	.text
global	_start
_start:
	; 首先，发送所有HTTP头部和XHTML内容
	push	dword httplen
	push	dword http
	push	dword stdout
	sys.write

	; 查找栈上环境变量指针的起始位置
	; 我们在“argc”之前已经推送了12个字节
	mov	eax, [esp+12]

	; 从栈中移除以下内容：
	; 1. sys.write所需的12字节
	; 2. argc的4字节
	; 3. argv所需的EAX*4字节
	; 4. argv之后的4字节NULL
	; 总计：
	; 20 + eax * 4
	; 因为栈是向下增长的，我们需要将这些字节数加到ESP中。
	lea	esp, [esp+20+eax*4]
	cld		; 确保标志已设置

	; 循环遍历环境变量并逐个打印
.loop:
	pop	edi
	or	edi, edi	; 检查是否遍历完环境变量
	je	near .wrap

	; 打印HTML表格的左部分（环境变量的名称）
	push	dword leftlen
	push	dword left
	push	dword stdout
	sys.write

	; 虽然可能会想直接查找'='，但是有些环境变量可能没有'='，因此我们先查找NULL字符。
	mov	esi, edi	; 保存字符串的起始位置
	sub	ecx, ecx
	not	ecx		; ECX = FFFFFFFF
	sub	eax, eax
repne	scasb
	not	ecx		; ECX = 字符串长度 + 1
	mov	ebx, ecx	; 将长度保存在EBX

	; 找到'='符号
	mov	edi, esi	; 字符串的起始位置
	mov	al, '='
repne	scasb
	not	ecx
	add	ecx, ebx	; 名称的长度

	; 打印名称部分
	push	ecx
	push	esi
	push	dword stdout
	sys.write

	; 打印HTML表格中间部分
	push	dword midlen
	push	dword middle
	push	dword stdout
	sys.write

	; 查找值的长度
	not	ecx
	lea	ebx, [ebx+ecx-1]

	; 如果值为0，则打印"undefined"
	or	ebx, ebx
	jne	.value

	mov	ebx, undeflen
	mov	edi, undef

.value:
	push	ebx
	push	edi
	push	dword stdout
	sys.write

	; 打印表格行的右部分
	push	dword rightlen
	push	dword right
	push	dword stdout
	sys.write

	; 清除已经推送的60字节
	add	esp, byte 60

	; 获取下一个环境变量
	jmp	.loop

.wrap:
	; 打印HTML的其余部分
	push	dword wraplen
	push	dword wrap
	push	dword stdout
	sys.write

	; 返回成功
	push	dword 0
	sys.exit

这段代码生成了一个 1,396 字节的可执行文件。大部分内容是数据，即我们需要发送的 HTML 标记。

按常规方法进行汇编和链接：

% nasm -f elf webvars.asm
% ld -s -o webvars webvars.o

要使用它，你需要将 webvars 上传到你的 Web 服务器。根据你的 Web 服务器配置，可能需要将它存储在一个特殊的 cgi-bin 目录中，或者可能需要将其重命名为 .cgi 扩展名。

A.11. 处理文件

我们已经做了一些基本的文件操作：我们知道如何打开和关闭文件，如何使用缓冲区读取和写入文件。但 UNIX® 在处理文件时提供了更多的功能。在本节中，我们将研究其中的一些，并最终编写一个很好的文件转换工具。

事实上，让我们从结果开始，也就是文件转换工具。在开始编程时，知道最终产品应该做什么总是能让编程变得更容易。

我广泛使用 tuc，但始终只是从其他操作系统转换为 UNIX®，从未反过来。我一直希望它能直接覆盖文件，而不是我必须将输出发送到另一个文件。大多数时候，我最终这样使用它：

% tuc myfile tempfile
% mv tempfile myfile

有了一个名为 ftuc 的工具，即 快速 tuc，就好了，我可以这样使用：

% ftuc myfile

因此，在这一章中，我们将用汇编语言编写 ftuc（原始的 tuc 是用 C 编写的），并在此过程中研究各种与文件相关的内核服务。

乍一看，文件转换似乎非常简单：你只需要去除回车符，对吗？

如果你回答是的，那就再想一想：这种方法大部分时间有效（至少对于 MS DOS 文本文件），但偶尔会失败。

问题在于，并不是所有非 UNIX® 文本文件的行都以回车符/换行符序列结束。有些文件使用仅回车符而没有换行符。其他文件将几个空行合并为一个回车符后接几个换行符。等等。

因此，文本文件转换器必须能够处理所有可能的行结束符：

回车符 / 换行符
回车符
换行符 / 回车符
换行符

它还应该处理使用上述某种组合的文件（例如，回车符后跟几个换行符）。

A.11.1. 有限状态机

这个问题可以通过一种叫做 有限状态机（finite state machine）的技术轻松解决，这种技术最初由数字电子电路的设计师们开发。有限状态机 是一种数字电路，其输出不仅依赖于输入，还依赖于其先前的输入，即它的状态。微处理器就是一个 有限状态机 的例子：我们的汇编语言代码被组装成机器语言，其中一些汇编语言代码产生一个字节的机器语言，而其他一些则产生多个字节。当微处理器一个一个地从内存中获取字节时，有些字节仅仅改变其状态，而不是产生任何输出。当所有的操作码字节被获取后，微处理器才会产生输出，或者改变寄存器的值，等等。

因此，所有软件本质上都是一系列为微处理器编写的状态指令。尽管如此，有限状态机 的概念在软件设计中也非常有用。

我们的文本文件转换器可以被设计成一个 有限状态机，有三种可能的状态。我们可以将它们称为状态 0 到 2，但如果我们为它们起个符号名字会更容易：

ordinary（普通）
cr（回车）
lf（换行）

我们的程序将从普通状态开始。在这个状态下，程序的动作取决于输入，具体如下：

如果输入是回车符或换行符以外的字符，输入会被直接传递到输出，状态保持不变。
如果输入是回车符，状态将切换到 cr，输入将被丢弃，即不输出任何内容。
如果输入是换行符，状态将切换到 lf，输入将被丢弃。

当我们处于 cr 状态时，意味着最后的输入是一个未处理的回车符。此时软件的行为依赖于当前输入：

如果输入是回车符或换行符以外的字符，则输出一个换行符，然后输出该输入，再将状态切换为普通状态。
如果输入是回车符，表示我们接收到了两个（或更多）连续的回车符。我们丢弃输入，输出一个换行符，并保持状态不变。
如果输入是换行符，我们输出换行符，并将状态切换为普通状态。注意，这与上面的第一种情况不同——如果我们尝试将它们合并，会导致输出两个换行符而不是一个。

最后，当我们接收到一个没有前置回车符的换行符时，我们会进入 lf 状态。这种情况发生在我们的文件已经是 UNIX® 格式，或者连续几行用一个回车符后跟多个换行符表示，或者行结束符是换行符/回车符序列时。在这个状态下，我们需要按照以下方式处理输入：

如果输入是回车符或换行符以外的字符，则输出一个换行符，然后输出该输入，再将状态切换为普通状态。这个操作与我们在 cr 状态下收到相同输入时的行为完全相同。
如果输入是回车符，我们丢弃输入，输出一个换行符，然后将状态切换为普通状态。
如果输入是换行符，我们输出换行符，并保持状态不变。

A.11.1.1. 最终状态

上述 有限状态机 适用于整个文件，但存在一个问题，即可能忽略最后一行的结束符。每当文件以单一的回车符或换行符结尾时，就会发生这种情况。我在编写 tuc 时没有考虑到这一点，后来才发现偶尔会剥离掉最后的行结束符。

这个问题可以通过在整个文件处理完毕后检查状态来轻松修复。如果状态不是普通状态，我们只需要输出一个最后的换行符。

注意
现在我们已经将算法表示为 有限状态机，我们完全可以设计一个专用的数字电子电路（"芯片"）来为我们执行转换。当然，这样做的成本要比编写汇编语言程序高得多。

A.11.1.2. 输出计数器

由于我们的文件转换程序可能会将两个字符合并为一个字符，因此我们需要使用一个输出计数器。我们将其初始化为 0，并在每次将字符发送到输出时增加计数。程序结束时，计数器将告诉我们需要设置文件的大小。

A.11.2. 在软件中实现 FSM

使用 有限状态机 的最大难点在于分析问题并将其表示为 有限状态机。一旦完成，软件几乎是自动生成的。

在高级语言中（如 C），有几种主要的方法。一个方法是使用 switch 语句来选择应该运行哪个函数。例如：

switch (state) {
	default:
	case REGULAR:
		regular(inputchar);
		break;
	case CR:
		cr(inputchar);
		break;
	case LF:
		lf(inputchar);
		break;
	}

另一种方法是使用一个函数指针数组，类似于这样：

(output[state])(inputchar);

还有一种方法是让 state 成为一个函数指针，指向适当的函数：

(*state)(inputchar);

我们在程序中将使用这种方法，因为它在汇编语言中非常容易实现，并且非常快速。我们将简单地将正确的程序地址存储在 EBX 中，然后执行：

call	ebx

这可能比硬编码地址更快，因为微处理器不需要从内存中获取地址——它已经存储在其寄存器之一中。我说可能更快，因为现代微处理器的缓存技术，任意一种方式可能同样快速。

A.11.3. 内存映射文件

由于我们的程序操作的是单个文件，因此不能使用之前的方式，即从输入文件读取并将其写入输出文件。

UNIX® 允许我们将一个文件，或文件的某个部分，映射到内存中。为此，我们首先需要使用适当的读写标志打开文件。然后我们使用 mmap 系统调用将其映射到内存中。mmap 的一个优点是它自动与虚拟内存协作：我们可以将文件的更多部分映射到内存中，即使我们没有足够的物理内存，但仍然可以通过常规的内存操作码，如 mov、lods 和 stos，访问它。我们对文件内存映像所做的任何更改将由系统写入文件中。我们甚至不需要保持文件打开：只要它保持映射，我们就可以读取和写入它。

32 位的英特尔微处理器可以访问最多四千兆字节的内存——无论是物理内存还是虚拟内存。FreeBSD 系统允许我们使用最多一半的内存进行文件映射。

为了简化起见，在本教程中，我们将仅转换那些能够完全映射到内存中的文件。很少有文本文件的大小超过两千兆字节。如果我们的程序遇到这样的文件，它将简单地显示一条消息，建议我们使用原始的 tuc。

如果您检查 syscalls.master，您将找到两个名为 mmap 的独立系统调用。这是因为 UNIX® 的发展：有传统的 BSD mmap，即系统调用 71。这个版本被 POSIX® 的 mmap（系统调用 197）所取代。FreeBSD 系统同时支持两者，因为较旧的程序是使用原始的 BSD 版本编写的。但新软件使用的是 POSIX® 版本，这也是我们将使用的版本。

syscalls.master 列出了 POSIX® 版本，如下所示：

197	STD	BSD	{ caddr_t mmap(caddr_t addr, size_t len, int prot, \
			    int flags, int fd, long pad, off_t pos); }

区别在于 long pad 参数，这在 C 版本中没有出现。然而，FreeBSD 系统调用会在 push 一个 64 位参数后，添加一个 32 位的填充。此时，off_t 是一个 64 位值。

当我们完成对内存映射文件的操作时，我们使用 munmap 系统调用来取消映射：

技巧

A.11.4. 确定文件大小

因为我们需要告诉 mmap 要将多少字节的文件映射到内存中，并且我们希望将整个文件映射到内存中，所以我们需要确定文件的大小。

我们可以使用 fstat 系统调用获取有关打开文件的所有信息，其中就包括文件大小。

同样，syscalls.master 列出了两个版本的 fstat，一个是传统的版本（系统调用 62），另一个是 POSIX® 版本（系统调用 189）。显然，我们将使用 POSIX® 版本：

189	STD	POSIX	{ int fstat(int fd, struct stat *sb); }

这是一个非常简单的调用：我们传入一个 stat 结构体的地址和一个打开文件的文件描述符。它会填充 stat 结构体的内容。

然而，我必须说我曾尝试将 stat 结构体声明在 .bss 区域，但 fstat 并不喜欢这种做法：它设置了进位标志，表示发生了错误。当我将代码更改为在堆栈上分配该结构体时，一切工作正常。

A.11.5. 更改文件大小

由于我们的程序可能会将回车/换行序列合并为单一的换行符，因此我们的输出可能会比输入小。然而，由于我们将输出放入与输入文件相同的文件中，我们可能需要更改文件的大小。

ftruncate 系统调用允许我们做到这一点。尽管其名称可能会让人误解，但 ftruncate 系统调用可以用来既截断文件（使其变小），也可以将文件扩展。

是的，我们会在 syscalls.master 中找到两个版本的 ftruncate，一个较旧的版本（130），一个较新的版本（201）。我们将使用较新的版本：

201	STD	BSD	{ int ftruncate(int fd, int pad, off_t length); }

请注意，这里再次包含了 int pad。

A.11.6. ftuc

现在我们已经知道了编写 ftuc 所需的一切。我们首先在 system.inc 中添加一些新行。首先，我们在文件的开始部分或接近开始的位置定义一些常量和结构体：

;;;;;;; 打开标志
%define	O_RDONLY	0
%define	O_WRONLY	1
%define	O_RDWR	2

;;;;;;; mmap 标志
%define	PROT_NONE	0
%define	PROT_READ	1
%define	PROT_WRITE	2
%define	PROT_EXEC	4
;;
%define	MAP_SHARED	0001h
%define	MAP_PRIVATE	0002h

;;;;;;; stat 结构体
struc	stat
st_dev		resd	1	; = 0
st_ino		resd	1	; = 4
st_mode		resw	1	; = 8, size is 16 bits
st_nlink	resw	1	; = 10, ditto
st_uid		resd	1	; = 12
st_gid		resd	1	; = 16
st_rdev		resd	1	; = 20
st_atime	resd	1	; = 24
st_atimensec	resd	1	; = 28
st_mtime	resd	1	; = 32
st_mtimensec	resd	1	; = 36
st_ctime	resd	1	; = 40
st_ctimensec	resd	1	; = 44
st_size		resd	2	; = 48, size is 64 bits
st_blocks	resd	2	; = 56, ditto
st_blksize	resd	1	; = 64
st_flags	resd	1	; = 68
st_gen		resd	1	; = 72
st_lspare	resd	1	; = 76
st_qspare	resd	4	; = 80
endstruc

我们定义新的系统调用：

%define	SYS_mmap	197
%define	SYS_munmap	73
%define	SYS_fstat	189
%define	SYS_ftruncate	201

我们为它们的使用添加宏：

%macro	sys.mmap	0
	system	SYS_mmap
%endmacro

%macro	sys.munmap	0
	system	SYS_munmap
%endmacro

%macro	sys.ftruncate	0
	system	SYS_ftruncate
%endmacro

%macro	sys.fstat	0
	system	SYS_fstat
%endmacro

以下是我们的代码：

;;;;;;; 快速文本到 Unix 转换 (ftuc.asm) ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;;
;; 开始日期：	2000年12月21日
;; 更新日期：	2000年12月22日
;;
;; 版权所有 2000 G. Adam Stanislav.
;; 保留所有权利。
;;
;;;;;;; v.1 ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
%include	'system.inc'

section	.data
	db	'版权所有 2000 G. Adam Stanislav.', 0Ah
	db	'保留所有权利。', 0Ah
usg	db	'用法： ftuc 文件名', 0Ah
usglen	equ	$-usg
co	db	"ftuc: 无法打开文件。", 0Ah
colen	equ	$-co
fae	db	'ftuc: 文件访问错误。', 0Ah
faelen	equ	$-fae
ftl	db	'ftuc: 文件过大，请使用常规的 tuc 工具。', 0Ah
ftllen	equ	$-ftl
mae	db	'ftuc: 内存分配错误。', 0Ah
maelen	equ	$-mae

section	.text

align 4
memerr:
	push	dword maelen
	push	dword mae
	jmp	short error

align 4
toolong:
	push	dword ftllen
	push	dword ftl
	jmp	short error

align 4
facerr:
	push	dword faelen
	push	dword fae
	jmp	short error

align 4
cantopen:
	push	dword colen
	push	dword co
	jmp	short error

align 4
usage:
	push	dword usglen
	push	dword usg

error:
	push	dword stderr
	sys.write

	push	dword 1
	sys.exit

align 4
global	_start
_start:
	pop	eax		; argc
	pop	eax		; 程序名称
	pop	ecx		; 要转换的文件
	jecxz	usage

	pop	eax
	or	eax, eax	; 参数太多？
	jne	usage

	; 打开文件
	push	dword O_RDWR
	push	ecx
	sys.open
	jc	cantopen

	mov	ebp, eax	; 保存文件描述符

	sub	esp, byte stat_size
	mov	ebx, esp

	; 获取文件大小
	push	ebx
	push	ebp		; fd
	sys.fstat
	jc	facerr

	mov	edx, [ebx + st_size + 4]

	; 如果 EDX != 0，则文件太大 ...
	or	edx, edx
	jne	near toolong
	mov	ecx, [ebx + st_size]
	; ... 或者文件超过 2 GB
	or	ecx, ecx
	js	near toolong

	; 如果文件大小为 0 字节，则不做任何操作
	jecxz	.quit

	; 将整个文件映射到内存中
	push	edx
	push	edx		; 从偏移量 0 开始
	push	edx		; 填充
	push	ebp		; fd
	push	dword MAP_SHARED
	push	dword PROT_READ | PROT_WRITE
	push	ecx		; 整个文件大小
	push	edx		; 让系统决定地址
	sys.mmap
	jc	near memerr

	mov	edi, eax
	mov	esi, eax
	push	ecx		; 对于 SYS_munmap
	push	edi

	; 使用 EBX 作为状态机
	mov	ebx, ordinary
	mov	ah, 0Ah
	cld

.loop:
	lodsb
	call	ebx
	loop	.loop

	cmp	ebx, ordinary
	je	.filesize

	; 输出最终的换行符
	mov	al, ah
	stosb
	inc	edx

.filesize:
	; 将文件截断为新大小
	push	dword 0		; 高字
	push	edx		; 低字
	push	eax		; 填充
	push	ebp
	sys.ftruncate

	; 关闭文件（ebp 仍然被压入栈）
	sys.close

	add	esp, byte 16
	sys.munmap

.quit:
	push	dword 0
	sys.exit

align 4
ordinary:
	cmp	al, 0Dh
	je	.cr

	cmp	al, ah
	je	.lf

	stosb
	inc	edx
	ret

align 4
.cr:
	mov	ebx, cr
	ret

align 4
.lf:
	mov	ebx, lf
	ret

align 4
cr:
	cmp	al, 0Dh
	je	.cr

	cmp	al, ah
	je	.lf

	xchg	al, ah
	stosb
	inc	edx

	xchg	al, ah
	; 继续执行

.lf:
	stosb
	inc	edx
	mov	ebx, ordinary
	ret

align 4
.cr:
	mov	al, ah
	stosb
	inc	edx
	ret

align 4
lf:
	cmp	al, ah
	je	.lf

	cmp	al, 0Dh
	je	.cr

	xchg	al, ah
	stosb
	inc	edx

	xchg	al, ah
	stosb
	inc	edx
	mov	ebx, ordinary
	ret

align 4
.cr:
	mov	ebx, ordinary
	mov	al, ah
	; 继续执行

.lf:
	stosb
	inc	edx
	ret

警告
请勿在由 MS-DOS® 或 Windows® 格式化的磁盘上的文件上使用此程序。当在 FreeBSD 下使用 mmap 挂载这些磁盘时，FreeBSD 代码似乎存在一个微妙的 bug：如果文件超过某个大小，mmap 会将内存填充为零，然后将这些零复制到文件中，覆盖其内容。

A.12. 一心一意的心态

作为禅宗的学生，我喜欢“一心一意”的想法：一次做一件事，并且做到最好。

实际上，这正是 UNIX® 的工作方式。典型的 Windows® 应用程序尝试做所有可以想象的事情（因此，充满了 bug），而典型的 UNIX® 程序只做一件事，而且做得很好。

典型的 UNIX® 用户基本上是通过编写一个 shell 脚本，将不同程序的输出通过管道连接起来，从而组装自己的应用程序。

在编写自己的 UNIX® 软件时，通常的好方法是，先看看现有的程序中有哪些部分可以帮助解决问题，然后只为那些没有现成解决方案的部分编写自己的程序。

A.12.1. CSV

我将通过一个具体的实际例子来说明这个原则：

我需要提取从网站下载的数据库中每条记录的第 11 个字段。这个数据库是一个 CSV 文件，即一个逗号分隔值的列表。这是一种常见的数据共享格式，用于不同数据库软件之间的数据交换。

文件的第一行包含以逗号分隔的各种字段列表。文件的其余部分包含逐行列出的数据，每行的值通过逗号分隔。

我尝试使用 awk，将逗号作为分隔符。但因为某些行中包含了带引号的逗号，awk 从这些行中提取到了错误的字段。

因此，我需要编写自己的软件来提取 CSV 文件中的第 11 个字段。然而，遵循 UNIX® 精神，我只需要编写一个简单的过滤程序，完成以下操作：

删除文件的第一行；
将所有未加引号的逗号替换为其他字符；
删除所有引号。

严格来说，我可以使用 sed 删除文件的第一行，但自己编写这个程序非常简单，因此我决定这么做，并减少管道的复杂性。

无论如何，编写这样的程序大约花了我 20 分钟。编写一个提取 CSV 文件第 11 个字段的程序会花费更长时间，而且我无法重用它来提取其他数据库中的其他字段。

这一次，我决定让程序做得比典型的教程程序多一些工作：

它解析命令行参数；
如果发现错误参数，它会显示正确的用法；
它会产生有意义的错误信息。

以下是它的用法信息：

用法：csv [-t<delim>] [-c<comma>] [-p] [-o <outfile>] [-i <infile>]

所有参数都是可选的，可以按任何顺序出现。

-t 参数声明用来替换逗号的字符。默认情况下是使用 tab。例如，-t; 会将所有未加引号的逗号替换为分号。

我并不需要 -c 选项，但将来可能会用到。它允许我声明要用其他字符替换逗号。比如，-c@ 会将所有的 @ 符号替换为其他字符（如果你想将一组电子邮件地址分割成用户名和域名，这非常有用）。

-p 选项保留第一行，即不删除它。默认情况下，我们会删除第一行，因为在 CSV 文件中，它包含的是字段名而不是数据。

-i 和 -o 选项让我指定输入文件和输出文件。默认值是 stdin 和 stdout，因此它是一个常规的 UNIX® 过滤器。

我确保 -i filename 和 -ifilename 都可以接受。我还确保只能指定一个输入文件和一个输出文件。

要获取每条记录的第 11 个字段，现在可以这样做：

% csv '-t;' data.csv | awk '-F;' '{print $11}'

该代码将选项（文件描述符除外）存储在 EDX 寄存器中：逗号存储在 DH 中，新的分隔符存储在 DL 中，-p 选项的标志存储在 EDX 的最高位中，因此检查其符号将快速决定我们应该执行什么操作。

下面是代码：

;;;;;;; csv.asm ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;
; 将逗号分隔的文件转换为其他分隔的文件。
;
; 开始时间： 31-May-2001
; 更新时间： 1-Jun-2001
;
; 版权所有 (c) 2001 G. Adam Stanislav
; 保留所有权利。
;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

%include	'system.inc'

%define	BUFSIZE	2048

section	.data
fd.in	dd	stdin
fd.out	dd	stdout
usg	db	'Usage: csv [-t<delim>] [-c<comma>] [-p] [-o <outfile>] [-i <infile>]', 0Ah
usglen	equ	$-usg
iemsg	db	"csv: Can't open input file", 0Ah
iemlen	equ	$-iemsg
oemsg	db	"csv: Can't create output file", 0Ah
oemlen	equ	$-oemsg

section .bss
ibuffer	resb	BUFSIZE
obuffer	resb	BUFSIZE

section	.text
align 4
ierr:
	push	dword iemlen
	push	dword iemsg
	push	dword stderr
	sys.write
	push	dword 1		; 返回失败
	sys.exit

align 4
oerr:
	push	dword oemlen
	push	dword oemsg
	push	dword stderr
	sys.write
	push	dword 2
	sys.exit

align 4
usage:
	push	dword usglen
	push	dword usg
	push	dword stderr
	sys.write
	push	dword 3
	sys.exit

align 4
global	_start
_start:
	add	esp, byte 8	; 丢弃 argc 和 argv[0]
	mov	edx, (',' << 8) | 9

.arg:
	pop	ecx
	or	ecx, ecx
	je	near .init		; 没有更多参数

	; ECX 包含一个参数的指针
	cmp	byte [ecx], '-'
	jne	usage

	inc	ecx
	mov	ax, [ecx]

.o:
	cmp	al, 'o'
	jne	.i

	; 确保没有要求输出文件两次
	cmp	dword [fd.out], stdout
	jne	usage

	; 查找输出文件路径 - 它可能在 [ECX+1]，
	; 即 -ofile --
	; 或者在下一个参数中，
	; 即 -o file

	inc	ecx
	or	ah, ah
	jne	.openoutput
	pop	ecx
	jecxz	usage

.openoutput:
	push	dword 420	; 文件模式（644 八进制）
	push	dword 0200h | 0400h | 01h
	; O_CREAT | O_TRUNC | O_WRONLY
	push	ecx
	sys.open
	jc	near oerr

	add	esp, byte 12
	mov	[fd.out], eax
	jmp	short .arg

.i:
	cmp	al, 'i'
	jne	.p

	; 确保没有要求输入文件两次
	cmp	dword [fd.in], stdin
	jne	near usage

	; 查找输入文件路径
	inc	ecx
	or	ah, ah
	jne	.openinput
	pop	ecx
	or	ecx, ecx
	je near usage

.openinput:
	push	dword 0		; O_RDONLY
	push	ecx
	sys.open
	jc	near ierr		; 打开失败

	add	esp, byte 8
	mov	[fd.in], eax
	jmp	.arg

.p:
	cmp	al, 'p'
	jne	.t
	or	ah, ah
	jne	near usage
	or	edx, 1 << 31
	jmp	.arg

.t:
	cmp	al, 't'		; 重新定义输出分隔符
	jne	.c
	or	ah, ah
	je	near usage
	mov	dl, ah
	jmp	.arg

.c:
	cmp	al, 'c'
	jne	near usage
	or	ah, ah
	je	near usage
	mov	dh, ah
	jmp	.arg

align 4
.init:
	sub	eax, eax
	sub	ebx, ebx
	sub	ecx, ecx
	mov	edi, obuffer

	; 检查是否需要保留第一行
	or	edx, edx
	js	.loop

.firstline:
	; 去掉第一行
	call	getchar
	cmp	al, 0Ah
	jne	.firstline

.loop:
	; 从 stdin 中读取一个字节
	call	getchar

	; 它是逗号（或用户要求的其他字符）吗？
	cmp	al, dh
	jne	.quote

	; 将逗号替换为制表符（或用户要求的字符）
	mov	al, dl

.put:
	call	putchar
	jmp	short .loop

.quote:
	cmp	al, '"'
	jne	.put

	; 打印直到遇到另一个引号或 EOL。如果是引号，跳过它。如果是 EOL，打印它。
.qloop:
	call	getchar
	cmp	al, '"'
	je	.loop

	cmp	al, 0Ah
	je	.put

	call	putchar
	jmp	short .qloop

align 4
getchar:
	or	ebx, ebx
	jne	.fetch

	call	read

.fetch:
	lodsb
	dec	ebx
	ret

read:
	jecxz	.read
	call	write

.read:
	push	dword BUFSIZE
	mov	esi, ibuffer
	push	esi
	push	dword [fd.in]
	sys.read
	add	esp, byte 12
	mov	ebx, eax
	or	eax, eax
	je	.done
	sub	eax, eax
	ret

align 4
.done:
	call	write		; 刷新输出缓冲区

	; 关闭文件
	push	dword [fd.in]
	sys.close

	push	dword [fd.out]
	sys.close

	; 返回成功
	push	dword 0
	sys.exit

align 4
putchar:
	stosb
	inc	ecx
	cmp	ecx, BUFSIZE
	je	write
	ret

align 4
write:
	jecxz	.ret	; 没有什么可写的
	sub	edi, ecx	; 缓冲区起始位置
	push	ecx
	push	edi
	push	dword [fd.out]
	sys.write
	add	esp, byte 12
	sub	eax, eax
	sub	ecx, ecx	; 缓冲区现在为空
.ret:
	ret

其中许多内容取自上文的 hex.asm。但有一个重要的不同之处：我不再在输出换行符时每次调用 write。然而，这段代码仍然可以交互式使用。

自从我开始写这一章以来，我找到了解决交互式问题的更好方法。我希望确保每一行只在需要时才单独打印出来。毕竟，在非交互式使用时，没有必要每次都刷新每一行。

我现在使用的新解决方案是在发现输入缓冲区为空时每次调用 write。这样，当程序在交互模式下运行时，它会从用户的键盘读取一行，处理它，然后发现输入缓冲区为空。接着，它刷新输出并读取下一行。

A.12.1.1. 缓冲的黑暗面

这个改变避免了在某些特定情况下出现的神秘锁死问题。我将其称为 缓冲的黑暗面，主要是因为它存在一个并不明显的危险。

这种情况在像上面提到的 CSV 程序中不太可能发生，所以我们来考虑另一个过滤器：在这种情况下，我们预期输入是表示颜色值的原始数据，如像素的红色、绿色和蓝色强度。我们的输出将是输入的负值。

这样的过滤器非常简单。它的大部分代码将与我们之前编写的其他过滤器非常相似，所以我只会展示其内部循环部分：

.loop:
	call	getchar
	not	al		; 创建负值
	call	putchar
	jmp	short .loop

因为这个过滤器处理的是原始数据，它不太可能在交互模式下使用。

但它可能会被图像处理软件调用。如果没有在每次调用 read 之前调用 write，它很可能会锁死。

以下是可能发生的情况：

图像编辑器使用 C 函数 popen() 加载我们的过滤器。
它从位图或像素图中读取第一行像素。
它将第一行像素写入到连接到我们过滤器的 fd.in 的管道中。
我们的过滤器从输入中读取每个像素，将其转为负值，并写入输出缓冲区。
我们的过滤器调用 getchar 来获取下一个像素。
getchar 发现输入缓冲区为空，于是它调用 read。
read 调用 SYS_read 系统调用。
内核将暂停我们的过滤器，直到图像编辑器将更多数据发送到管道。
图像编辑器从连接到我们过滤器的 fd.out 的另一个管道中读取，以便在发送第二行输入之前先设置第一行输出图像。
内核暂停图像编辑器，直到它收到来自我们过滤器的某些输出，以便可以将其传递给图像编辑器。

此时，我们的过滤器等待图像编辑器发送更多数据供其处理，而图像编辑器在等待我们过滤器发送处理后的第一行结果。可是，结果仍然停留在输出缓冲区中。

如果我们的过滤器在请求内核获取更多输入数据之前刷新其输出缓冲区，这个问题就不会发生。

A.13. 使用 FPU

奇怪的是，大多数汇编语言文献甚至没有提到 FPU（浮点单元）的存在，更不用说讨论如何编程它了。

然而，汇编语言的光辉从未如此闪耀，尤其是在我们通过做一些只有 汇编语言 才能完成的事情来创建高度优化的 FPU 代码时。

A.13.1. FPU 的组织结构

FPU 包含 8 个 80 位的浮点寄存器。这些寄存器以栈的方式组织——你可以将一个值 push 到栈顶（TOS，top of stack），也可以将其 pop 出来。

不过，汇编语言中的操作码不是 push 和 pop，因为这些操作码已经被占用了。

你可以通过使用 fld、fild 和 fbld 将值 push 到 TOS。还有一些其他的操作码允许你将一些常见的常量（例如 π）推送到 TOS。

类似地，你可以使用 fst、fstp、fist、fistp 和 fbstp 来将值 pop 出来。实际上，只有那些以 p 结尾的操作码才会真正“弹出”该值，其余的则会将值存储到其他地方，而不会将其从 TOS 中移除。

我们可以将数据在 TOS 和计算机内存之间传输，无论是作为 32 位、64 位或 80 位的实数，16 位、32 位或 64 位的整数，还是 80 位的 打包十进制。

80 位 打包十进制 是一种特殊的 二进制编码十进制，在将数据的 ASCII 表示与 FPU 内部数据进行转换时非常方便。它允许我们使用 18 位有效数字。

无论我们如何在内存中表示数据，FPU 始终将其以 80 位的实数格式存储在寄存器中。

它的内部精度至少为 19 位十进制数字，因此即使我们选择以完整的 18 位精度显示结果，我们仍然能够显示正确的结果。

我们可以在 TOS 上执行数学运算：我们可以计算其正弦，可以对其进行缩放（即可以将其乘以或除以 2 的幂），我们可以计算其以 2 为底的对数，以及许多其他操作。

我们还可以将其乘以或除以，加或减，任何 FPU 寄存器中的值（包括它自身）。

官方的 Intel 操作码为 TOS 是 st，而寄存器为 st(0) 至 st(7)。因此，st 和 st(0) 指代的是同一个寄存器。

出于某些原因，nasm 的原作者决定使用不同的操作码，即 st0 至 st7。换句话说，没有圆括号，TOS 始终是 st0，从不单独使用 st。

A.13.1.1. 打包十进制格式

打包十进制 格式使用 10 字节（80 位）内存来表示 18 位数字。所表示的数字始终是整数。

技巧
你可以通过先将 TOS 乘以 10 的幂来获得小数位。

最高字节（字节 9）的最高位是 符号位：如果设置为 1，表示数字为负数；否则为正数。该字节的其余位未使用/忽略。

剩余的 9 个字节存储数字的 18 位：每个字节存储 2 位数字。

更高位的数字 存储在高 半字节（4 位），较低位的数字 存储在低 半字节 中。

话虽如此，你可能会认为 -1234567 会以如下方式存储在内存中（使用十六进制表示）：

80 00 00 00 00 00 01 23 45 67

可惜并不是！像所有其他 Intel 的东西一样，即使是 打包十进制 也是小端存储的。

这意味着我们的 -1234567 是这样存储的：

67 45 23 01 00 00 00 00 00 80

记住这一点，否则你会因绝望而拔掉头发！

注意

A.13.2. 针孔摄影的探索

为了编写有意义的软件，我们不仅需要理解我们的编程工具，还需要理解我们为其开发软件的领域。

我们的下一个过滤器将帮助我们在构建 针孔相机 时，所以在继续之前，我们需要了解一些 针孔摄影 的背景知识。

A.13.2.1. 相机

描述任何相机最简单的方法就是将其视为一个被某种防光材料包围的空腔，腔体上有一个小孔。

这个外壳通常是坚固的（例如一个盒子），有时也可能是柔性的（如伸缩筒）。相机内部相当黑暗。然而，小孔允许光线通过一个点进入（尽管在某些情况下可能有多个点）。这些光线形成了一个图像，表示相机外部的景物，位于小孔前面。

如果相机内部放置一些感光材料（例如胶片），它就能捕捉到图像。

小孔常常包含一个镜头，或镜头组件，通常称为物镜。

A.13.2.2. 针孔

但严格来说，镜头并不是必须的：最初的相机并没有使用镜头，而是使用了针孔。即便今天，针孔仍然被用作研究相机工作原理的工具，并用来实现一种特殊的图像效果。

针孔产生的图像是均匀清晰的，或者是 模糊的。针孔有一个理想的大小：如果它过大或过小，图像会失去锐度。

A.13.2.3. 焦距

这个理想的针孔直径是焦距的平方根的函数，焦距是针孔到胶片的距离。

D = PC * sqrt(FL)

其中，D 是理想的针孔直径，FL 是焦距，PC 是针孔常数。根据 Jay Bender 的说法，常数的值为 0.04，而 Kenneth Connors 确定其值为 0.037。其他人也提出了不同的值。而且，这个常数仅适用于日光：其他类型的光线将需要不同的常数，其值只能通过实验确定。

A.13.2.4. 光圈数

光圈数是衡量光线达到胶片的多少的一个非常有用的指标。一个光度计可以确定，例如，为了曝光某种特定灵敏度的胶片，f5.6 光圈可能需要曝光 1/1000 秒。

无论是 35 毫米相机，还是 6x9cm 相机等等，只要知道光圈数，我们就能确定适当的曝光时间。

光圈数的计算很简单：

F = FL / D

换句话说，光圈数等于焦距除以针孔直径。这也意味着较高的光圈数要么意味着较小的针孔，要么意味着较大的焦距，或者两者兼有。反过来，这意味着光圈数越高，曝光时间需要越长。

此外，虽然针孔直径和焦距是单维度的度量，但胶片和针孔都是二维的。这意味着，如果你在光圈数 A 下测量的曝光时间是 t，那么在光圈数 B 下的曝光时间就是：

t * (B / A)²

A.13.2.5. 标准化光圈数

虽然许多现代相机可以平滑而逐渐地改变针孔的直径，从而改变其光圈数，但并非总是如此。

为了适应不同的光圈数，相机通常包含一块金属板，上面钻有几个不同大小的孔。

这些孔的大小是根据上述公式选择的，以使得最终的光圈数是所有相机上使用的标准光圈数之一。例如，我拥有的一台非常旧的 Kodak Duaflex IV 相机就有三个这样的孔，光圈数分别为 8、11 和 16。

一台较新的相机可能提供的光圈数包括 2.8、4、5.6、8、11、16、22 和 32（以及其他值）。这些数字并不是随意选择的：它们都是 2 的平方根的幂，尽管它们可能被四舍五入了一些。

A.13.2.6. 光圈

典型的相机设计方式是，设置任何标准化的光圈数都会改变转盘的感觉。它会自然地在那个位置停止。因此，这些转盘的位置被称为光圈档。

由于每个档的光圈数都是 2 的平方根的幂，因此将转盘移动 1 个档位将使所需的光线量翻倍。移动 2 个档位将使所需的曝光量增加 4 倍。移动 3 个档位则会使曝光量增加 8 倍，依此类推。

A.13.3. 设计针孔软件

现在，我们可以决定我们的针孔软件到底要做什么。

A.13.3.1. 处理程序输入

由于其主要目的是帮助我们设计一个工作的针孔相机，我们将使用焦距作为程序的输入。这是我们可以在没有软件的情况下确定的：合适的焦距由胶片的大小以及拍摄“常规”照片、广角照片或远摄照片的需求决定。

到目前为止，我们编写的大多数程序都处理单个字符或字节作为输入：hex 程序将单个字节转换为十六进制数字，csv 程序则让一个字符通过，或删除它，或将其转换为另一个字符，等等。

有一个程序，ftuc 使用状态机最多处理两个输入字节。

但是，我们的针孔程序不能仅仅处理单个字符，它必须处理更大的语法单元。

例如，如果我们希望程序在焦距为 100 mm、150 mm 和 210 mm 时计算针孔直径（以及后续讨论的其他值），我们可能希望输入如下内容：

100, 150, 210

我们的程序需要同时处理多个字节的输入。当它看到第一个 1 时，它必须理解这是看到一个十进制数字的第一个数字。当它看到 0 和另一个 0 时，它必须知道这些是同一数字的后续数字。

当它遇到第一个逗号时，它必须知道不再接收第一个数字的数字。它必须能够将第一个数字的数字转换为值 100，第二个数字转换为值 150，当然，第三个数字转换为数值 210。

我们需要决定接受哪些分隔符：输入的数字必须用逗号分隔吗？如果是这样，如何处理由其他字符分隔的两个数字？

就我个人而言，我喜欢保持简单。要么是数字，我就处理它；要么不是数字，我就丢弃它。我不喜欢计算机抱怨我输入了一个额外的字符，特别是当那个字符显然是多余的时。天呐！

此外，这样做还可以打破计算的单调性，让我输入一个查询，而不仅仅是一个数字：

What is the best pinhole diameter for the
	    focal length of 150?

没有理由让计算机输出一堆抱怨：

Syntax error: What
Syntax error: is
Syntax error: the
Syntax error: best

等等，等等，等等。

其次，我喜欢使用 # 字符来表示从此开始到行尾的注释。这不需要太多编码工作，并且允许我将输入文件当作可执行脚本来处理。

在我们的案例中，我们还需要决定输入应使用什么单位：我们选择毫米，因为大多数摄影师都使用这个单位来测量焦距。

最后，我们需要决定是否允许使用小数点（在这种情况下，我们还必须考虑到许多国家使用小数逗号）。

在我们这个情况下，允许使用小数点或逗号会带来一种虚假的精度感：焦距 50 和 51 之间几乎没有明显的差别，所以允许用户输入像 50.5 这样的数值并不是一个好主意。这是我的个人观点，毕竟我是写这个程序的人。当然，你可以在自己的程序中做出不同的选择。

A.13.3.2. 提供选项

在构建针孔相机时，我们最需要知道的是针孔的直径。由于我们希望拍摄清晰的图像，我们将使用上述公式根据焦距来计算针孔的直径。由于专家们提供了不同的 PC 常数值，我们需要能够选择。

在 UNIX® 编程中，传统上有两种主要的选择程序参数的方法，并且在用户未做选择时，会有一个默认值。

为什么要有两种选择方式？

其中一种是允许（相对）永久的选择，这种选择每次运行软件时都会自动应用，而无需我们一遍又一遍地告诉它我们希望它做什么。

永久选择通常保存在配置文件中，通常位于用户的主目录中。该文件通常与应用程序同名，但前面加上一个点。通常会在文件名后加上 "rc"。因此，我们的文件可以是 ~/.pinhole 或 ~/.pinholerc。（~/ 表示当前用户的主目录。）

配置文件主要由具有多个可配置参数的程序使用。那些只有一个（或少量）参数的程序则常常使用另一种方法：它们期望在 环境变量 中找到该参数。在我们的情况下，我们可以查看名为 PINHOLE 的环境变量。

通常，一个程序只会使用上述两种方法之一。如果同时配置文件和环境变量中指定了不同的内容，程序可能会感到困惑（或者变得过于复杂）。

由于我们只需要选择一个这样的参数，我们将采用第二种方法，查找名为 PINHOLE 的环境变量。

另一种方式允许我们做临时的决策：“虽然我通常希望你使用 0.039，但这次我想要 0.03872。” 换句话说，它允许我们覆盖永久选择。

这种类型的选择通常通过命令行参数来完成。

最后，程序总是需要一个 默认值。用户可能不会做出任何选择。也许他不知道该选择什么，也许他只是“随便看看”。理想情况下，默认值将是大多数用户会选择的值。这样，他们就不需要选择。或者，准确地说，他们可以不做额外的努力而选择默认值。

在这种系统下，程序可能会找到相互冲突的选项，并以以下方式处理它们：

如果它找到一个临时选择（例如，命令行参数），它应该接受该选择。它必须忽略任何永久选择和默认值。
否则，如果它找到一个永久选项（例如，环境变量），它应该接受该选项，并忽略默认值。
否则，它应该使用默认值。

我们还需要决定 PC 选项的格式应该是什么。

乍一看，使用 PINHOLE=0.04 格式的环境变量和 -p0.04 格式的命令行似乎是显而易见的。

然而，允许这样做实际上是一个安全隐患。PC 常数是一个非常小的数字。我们自然会使用不同的小值来测试我们的软件。但是，如果有人运行程序时选择了一个非常大的值，会发生什么呢？

程序可能会崩溃，因为我们没有设计它来处理巨大的数字。

或者，我们可能会花更多时间在程序上，使其能够处理巨大的数字。如果我们是在为计算机文盲的用户编写商业软件，可能会这样做。

或者，我们可能会说：“真倒霉！用户应该更懂得分寸。”

或者，我们可能干脆让用户无法输入巨大的数字。这就是我们要采取的做法：我们将使用一个 隐式 0. 前缀。

换句话说，如果用户希望输入 0.04，我们将期望他输入 -p04，或者在他的环境变量中设置 PINHOLE=04。因此，如果他说 -p9999999，我们将把它解释为 0.9999999——尽管仍然荒谬，但至少更加安全。

其次，许多用户可能只是想使用 Bender 的常数或 Connors 的常数。为了让他们更方便，我们将解释 -b 为与 -p04 相同，-c 为与 -p037 相同。

A.13.3.3. 输出

我们需要决定我们的软件要发送什么内容到输出，以及使用何种格式。

由于我们的输入允许不指定焦距条目的数量，因此使用传统的数据库样式输出每个焦距计算结果在一行中显示，且将每行中的所有值通过 tab 字符分隔是合乎逻辑的。

可选地，我们还应该允许用户指定使用我们之前学习过的 CSV 格式。在这种情况下，我们将首先输出一行由逗号分隔的名称，描述每一行的每个字段，然后像之前一样显示我们的结果，但用 comma 替换 tab。

我们需要为 CSV 格式提供一个命令行选项。我们不能使用 -c，因为它已经意味着 使用 Connors' 常数。由于某些奇怪的原因，许多网站将 CSV 文件称为 “Excel 电子表格”（尽管 CSV 格式早于 Excel）。因此，我们将使用 -e 选项来通知我们的软件我们希望输出为 CSV 格式。

我们将从输出的每一行的焦距开始。这乍一看可能会显得重复，尤其是在交互模式下：用户输入焦距，而我们又重复一遍。

但用户可以在一行中输入多个焦距。输入也可以来自文件，或者来自其他程序的输出。在这种情况下，用户根本看不到输入。

同样，输出可以被保存到一个文件中，我们之后可能会查看它，或者它可以打印出来，或者成为另一个程序的输入。

因此，从每一行开始都显示用户输入的焦距是完全合适的。

等等！不，不能直接按用户输入的方式显示。如果用户输入了像这样的内容：

00000000150

显然，我们需要去掉这些前导零。

所以，我们可能考虑按原样读取用户输入，在 FPU 中将其转换为二进制，然后从那里打印出来。

但是……

如果用户输入了像这样的内容：

17459765723452353453534535353530530534563507309676764423

哈哈！打包十进制 FPU 格式允许我们输入 18 位数字。但是用户输入了超过 18 位的数字。我们该如何处理？

嗯，我们可以修改代码，读取前 18 位数字，将其输入到 FPU，然后读取更多数字，将我们已经在 TOS 上的结果乘以 10 的幂，然后 add 到它。

是的，我们可以这么做。但是在这个程序中这是荒谬的（在另一个程序中可能正合适）：即使地球的周长用毫米表示也只需要 11 位数字。显然，我们不可能制造出这么大的相机（至少现在不行）。

所以，如果用户输入了如此巨大的数字，他要么是无聊，要么是在测试我们，要么是在尝试破坏系统，或者在玩游戏——总之，做的不是设计一个针孔相机。

我们该怎么做？

从某种意义上说，我们会给他一巴掌：

17459765723452353453534535353530530534563507309676764423	???	???	???	???	???

为了实现这一点，我们将简单地忽略所有前导零。一旦我们找到一个非零数字，我们将初始化一个计数器为 0，并开始执行三个步骤：

将数字发送到输出。
将数字附加到一个缓冲区，稍后我们将用它来生成可以发送到 FPU 的打包十进制。
增加计数器。

现在，在执行这三个步骤时，我们还需要警惕以下两种情况之一：

如果计数器超过 18，我们停止将数字附加到缓冲区。我们继续读取数字并发送它们到输出。
如果，或者说当，下一个输入字符不是数字时，我们就完成输入了。

顺便提一句，我们可以简单地丢弃非数字字符，除非它是 #，这种字符必须返回到输入流中。它表示开始一个注释，所以我们必须在完成输出生成后看到它，并开始查找更多的输入。

这仍然有一个未覆盖的情况：如果用户输入的只是零（或多个零），我们将永远找不到非零数字来显示。

我们可以在计数器保持为 0 时确定已经发生了这种情况。在这种情况下，我们需要将 0 输出，并进行另一次“巴掌”：

0	???	???	???	???	???

一旦我们显示了焦距并确认其有效（大于 0 且不超过 18 位数字），我们就可以计算针孔直径。

并非巧合的是，pinhole 包含了 pin 一词。实际上，许多针孔字面上就是 pin hole，即用针尖小心打孔的孔。

这就是因为典型的针孔非常小。我们的公式给出的结果是以毫米为单位的。我们将其乘以 1000，以便将结果以微米为单位输出。

在这时，我们将面临另一个问题：过高的精度。

是的，FPU 是为高精度数学设计的。但我们并不是在进行高精度数学计算。我们在处理的是物理学（特别是光学）。

假设我们想把一辆卡车改造成一个针孔相机（我们不会是第一个这么做的人！）。假设它的箱体长度为 12 米，所以焦距是 12000。使用 Bender 的常数，得出的是 12000 的平方根乘以 0.04，即 4.381780460 毫米，或者 4381.780460 微米。

无论哪种方式，结果都显得极为精确。我们的卡车不可能恰好是 12000 毫米长。我们没有用如此精确的标准来测量它的长度，因此说我们需要一个直径为 4.381780460 毫米的针孔是有误导性的。4.4 毫米就足够了。

注意
我在上面的例子中只用了十个数字。想象一下，如果我们追求所有 18 位数字的精度，那会有多荒谬！

我们需要限制结果的有效数字位数。一种方法是使用一个整数表示微米。所以，我们的卡车需要一个直径为 4382 微米的针孔。看看这个数字，我们仍然可以决定 4400 微米或 4.4 毫米就足够接近。

此外，我们还可以决定，无论结果多么大，我们只想显示四个有效数字（当然，也可以选择其他数字）。然而，FPU 并不提供四舍五入到特定数字位数的功能（毕竟，它并不是将数字视为十进制，而是视为二进制）。

因此，我们必须设计一个算法来减少有效数字位数。

这是我的算法（我觉得它有点笨拙——如果你知道一个更好的，请告诉我）：

将计数器初始化为 0。
当数字大于或等于 10000 时，将其除以 10 并增加计数器。
输出结果。
当计数器大于 0 时，输出 0 并减少计数器。

注意
如果你想要四个有效数字，10000 就合适。如果需要其他数量的有效数字，请将 10000 替换为 10 的对应幂。然后，我们将输出以微米为单位的针孔直径，四舍五入到四个有效数字。

此时，我们已经知道了焦距和 针孔直径，这意味着我们也有足够的信息来计算 f 值。

我们将显示 f 值，四舍五入到四个有效数字。f 值可能不会告诉我们太多信息。为了让它更有意义，我们可以找出最接近的 归一化 f 值，即最接近的平方根 2 的幂。

我们通过将实际的 f 值自乘来实现这一点，这当然会给我们它的平方。然后，我们计算它的以 2 为底的对数，这比计算以平方根 2 为底的对数要容易得多！我们将结果四舍五入到最接近的整数。接下来，我们将 2 乘以这个结果，实际上，FPU 为我们提供了一个很好的捷径：我们可以使用 fscale 操作码来“缩放” 1，这类似于将整数左移。最后，我们计算它的平方根，我们就得到了最接近的归一化 f 值。

如果以上内容听起来让人不知所措——或者感觉工作量太大——也许看到代码后会变得更清晰。总共需要 9 条操作码：

fmul	st0, st0
	fld1
	fld	st1
	fyl2x
	frndint
	fld1
	fscale
	fsqrt
	fstp	st1

第一行，fmul st0, st0，将 TOS（栈顶，称为 st0）的内容平方。fld1 将 1 推送到 TOS。

接下来，fld st1 将平方值再次推送到 TOS。此时，平方值既在 st 中，也在 st(2) 中（稍后会清楚为什么我们在栈上保留第二个副本）。st(1) 包含 1。

接下来，fyl2x 计算 st 与 st(1) 相乘后的以 2 为底的对数。这就是为什么我们在 st(1) 上放置 1 的原因。

此时，st 包含我们刚刚计算出的对数，st(1) 包含我们保存待用的实际 f 值的平方。

frndint 将 TOS 四舍五入到最接近的整数。fld1 再次推送 1。fscale 通过 st(1) 中的值来移动 TOS 上的 1，有效地将 2 的 st(1) 次幂。

最后，fsqrt 计算结果的平方根，即最接近的归一化 f 值。

现在，我们在 TOS 上有了最接近的归一化 f 值，st(1) 中有四舍五入后的以 2 为底的对数，而 st(2) 中仍然保存着我们实际的 f 值的平方。

但是我们不再需要 st(1) 中的内容。最后一行，fstp st1 将 st 中的内容存放到 st(1) 中，并将其弹出。结果，st(1) 的内容现在变成了 st，st(2) 变成了 st(1)，依此类推。新的 st 包含归一化 f 值，新的 st(1) 包含我们存储的实际 f 值的平方。

此时，我们准备输出归一化的 f 值。由于它是归一化的，我们将不对其进行四舍五入到四个有效数字，而是将其以完整的精度输出。

归一化的 f 值在它足够小并且可以在光照计上找到的情况下非常有用。否则，我们需要另一种确定合适曝光的方法。

之前我们已经弄清楚了如何从在不同 f 值下测量的曝光中计算适当的曝光。

我见过的所有光照计都能确定在 f5.6 下的适当曝光。因此，我们将计算一个 “f5.6 乘数”，即我们需要将 f5.6 下测得的曝光乘以多少，才能确定我们针孔相机的合适曝光。

根据上面的公式，我们知道这个乘数可以通过将我们的 f 值（实际值，而不是归一化值）除以 5.6 并平方来计算。

在数学上，将我们的 f 值的平方除以 5.6 的平方会得到相同的结果。

从计算的角度看，我们不希望平方两个数字，尤其是当我们可以只平方一个数字时。因此，第一种解决方案看起来更好。

但是……

5.6 是一个常数。我们不需要让 FPU 浪费宝贵的周期。我们可以直接告诉它除以 5.6² 的结果，或者我们可以先将 f 值除以 5.6，然后平方结果。两者现在看起来差不多。

但它们并不相同！

通过上述摄影原理的学习，我们记得 5.6 实际上是 2 的平方根的五次方。一个 无理数。这个数字的平方正好是 32。

不仅 32 是一个整数，而且它是 2 的幂。我们不需要将 f 值的平方除以 32。我们只需要使用 fscale 将其右移五位。用 FPU 术语来说，就是我们将 fscale 它，st(1) 为 -5。这比除法要 快得多。

所以，现在已经清楚为什么我们在 FPU 栈上保存了 f 值的平方。计算 f5.6 乘数是这个程序中最简单的计算！我们将将它四舍五入到四个有效数字并输出。

还有一个有用的数字可以计算：我们的 f 值与 f5.6 之间的停距。这可能会帮助我们，如果我们的 f 值刚好超出光照计的范围，但我们有一个可以设置不同速度的快门，并且这个快门使用停距。

假设我们的 f 值与 f5.6 相差 5 停距，而光照计显示我们应该使用 1/1000 秒。那么我们可以首先设置快门速度为 1/1000，然后将拨盘调节 5 停距。

这个计算也很简单。我们所要做的就是计算我们刚刚计算的 f5.6 乘数的以 2 为底的对数（但我们需要的是它的未四舍五入的值）。然后我们将结果四舍五入到最接近的整数。我们不需要担心它有超过四个有效数字，因为结果很可能只有一位或两位数字。

A.13.4. FPU 优化

在汇编语言中，我们可以通过一些高语言（包括 C）无法做到的方式优化 FPU 代码。

每当 C 函数需要计算一个浮点值时，它会将所有必要的变量和常量加载到 FPU 寄存器中。然后，它执行所需的计算以获得正确的结果。优秀的 C 编译器可以很好地优化代码的这一部分。

它通过将结果保留在 TOS（栈顶）上来“返回”值。然而，在返回之前，它会进行清理。它所使用的任何变量和常量都会从 FPU 中移除。

它不能像我们刚才所做的那样：我们计算了 f 值的平方，并将其保留在栈上，以便稍后由另一个函数使用。

我们知道我们稍后会需要这个值。我们还知道栈上有足够的空间（栈上最多能存放 8 个数字）来存储这个值。

而 C 编译器无法知道它在栈上的某个值会在不久的将来再次需要。

当然，C 程序员可能知道这一点，但唯一的解决方法就是将值存储到内存变量中。

这意味着：首先，值将从 FPU 内部使用的 80 位精度转换为 C 中的 double（64 位）或甚至 single（32 位）。

这也意味着该值必须从 TOS 移到内存中，然后再移回来。可惜的是，所有 FPU 操作中，访问计算机内存的操作是最慢的。

因此，在用汇编语言编写 FPU 代码时，尽量保持中间结果在 FPU 栈上。

我们甚至可以进一步优化！在我们的程序中，我们使用了一个常量（我们命名为 PC）。

无论我们计算多少个针孔直径：1、10、20、1000，我们始终使用相同的常量。因此，我们可以通过将常量常驻栈上来优化程序。

在程序的早期，我们计算上述常量的值。我们需要将输入除以 10，每个常量的每个数字都需要这样做。

乘法比除法要快得多。因此，在程序开始时，我们将 10 除以 1 得到 0.1，然后将其保留在栈上：与其每次为每个数字除以 10，不如将其乘以 0.1。

顺便说一句，我们并没有直接输入 0.1，尽管我们可以这么做。我们这样做是有原因的：虽然 0.1 只需要一个小数位就能表示，但我们并不知道它在 二进制 中需要多少位。因此，我们让 FPU 计算其二进制值，精度由 FPU 自行决定。

我们还使用了其他常量：我们将针孔直径乘以 1000，以将其从毫米转换为微米；在将数字四舍五入到四个有效数字时，我们用 10000 来进行比较。所以，我们将 1000 和 10000 都保留在栈上。当然，我们在将数字四舍五入到四位时，也会重新使用 0.1。

最后但同样重要的是，我们将 -5 保留在栈上。我们需要它来缩放 f 值的平方，而不是将其除以 32。并且并非巧合，我们最后加载这个常量。这使得它在栈上是最顶层的常量。当 f 值的平方被缩放时，-5 就在 st(1) 上，正是 fscale 所期望的位置。

通常我们会从头创建某些常量，而不是从内存中加载它们。这就是我们对 -5 所做的事情：

fld1			; TOS =  1
	fadd	st0, st0	; TOS =  2
	fadd	st0, st0	; TOS =  4
	fld1			; TOS =  1
	faddp	st1, st0	; TOS =  5
	fchs			; TOS = -5

我们可以将这些优化总结为一个规则：将重复的值保留在栈上！

注意
PostScript® 是一种基于栈的编程语言。关于 PostScript® 的书籍要比关于 FPU 汇编语言的书籍多得多：掌握 PostScript® 将帮助你掌握 FPU。

A.13.5. 针孔-代码

;;;;;;; pinhole.asm ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
;
; Find various parameters of a pinhole camera construction and use
;
; Started:	 9-Jun-2001
; Updated:	10-Jun-2001
;
; Copyright (c) 2001 G. Adam Stanislav
; All rights reserved.
;
;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;

%include	'system.inc'

%define	BUFSIZE	2048

section	.data
align 4
ten	dd	10
thousand	dd	1000
tthou	dd	10000
fd.in	dd	stdin
fd.out	dd	stdout
envar	db	'PINHOLE='	; Exactly 8 bytes, or 2 dwords long
pinhole	db	'04,', 		; Bender's constant (0.04)
connors	db	'037', 0Ah	; Connors' constant
usg	db	'Usage: pinhole [-b] [-c] [-e] [-p <value>] [-o <outfile>] [-i <infile>]', 0Ah
usglen	equ	$-usg
iemsg	db	"pinhole: Can't open input file", 0Ah
iemlen	equ	$-iemsg
oemsg	db	"pinhole: Can't create output file", 0Ah
oemlen	equ	$-oemsg
pinmsg	db	"pinhole: The PINHOLE constant must not be 0", 0Ah
pinlen	equ	$-pinmsg
toobig	db	"pinhole: The PINHOLE constant may not exceed 18 decimal places", 0Ah
biglen	equ	$-toobig
huhmsg	db	9, '???'
separ	db	9, '???'
sep2	db	9, '???'
sep3	db	9, '???'
sep4	db	9, '???', 0Ah
huhlen	equ	$-huhmsg
header	db	'focal length in millimeters,pinhole diameter in microns,'
	db	'F-number,normalized F-number,F-5.6 multiplier,stops '
	db	'from F-5.6', 0Ah
headlen	equ	$-header

section .bss
ibuffer	resb	BUFSIZE
obuffer	resb	BUFSIZE
dbuffer	resb	20		; decimal input buffer
bbuffer	resb	10		; BCD buffer

section	.text
align 4
huh:
	call	write
	push	dword huhlen
	push	dword huhmsg
	push	dword [fd.out]
	sys.write
	add	esp, byte 12
	ret

align 4
perr:
	push	dword pinlen
	push	dword pinmsg
	push	dword stderr
	sys.write
	push	dword 4		; return failure
	sys.exit

align 4
consttoobig:
	push	dword biglen
	push	dword toobig
	push	dword stderr
	sys.write
	push	dword 5		; return failure
	sys.exit

align 4
ierr:
	push	dword iemlen
	push	dword iemsg
	push	dword stderr
	sys.write
	push	dword 1		; return failure
	sys.exit

align 4
oerr:
	push	dword oemlen
	push	dword oemsg
	push	dword stderr
	sys.write
	push	dword 2
	sys.exit

align 4
usage:
	push	dword usglen
	push	dword usg
	push	dword stderr
	sys.write
	push	dword 3
	sys.exit

align 4
global	_start
_start:
	add	esp, byte 8	; discard argc and argv[0]
	sub	esi, esi

.arg:
	pop	ecx
	or	ecx, ecx
	je	near .getenv		; no more arguments

	; ECX contains the pointer to an argument
	cmp	byte [ecx], '-'
	jne	usage

	inc	ecx
	mov	ax, [ecx]
	inc	ecx

.o:
	cmp	al, 'o'
	jne	.i

	; Make sure we are not asked for the output file twice
	cmp	dword [fd.out], stdout
	jne	usage

	; Find the path to output file - it is either at [ECX+1],
	; i.e., -ofile --
	; or in the next argument,
	; i.e., -o file

	or	ah, ah
	jne	.openoutput
	pop	ecx
	jecxz	usage

.openoutput:
	push	dword 420	; file mode (644 octal)
	push	dword 0200h | 0400h | 01h
	; O_CREAT | O_TRUNC | O_WRONLY
	push	ecx
	sys.open
	jc	near oerr

	add	esp, byte 12
	mov	[fd.out], eax
	jmp	short .arg

.i:
	cmp	al, 'i'
	jne	.p

	; Make sure we are not asked twice
	cmp	dword [fd.in], stdin
	jne	near usage

	; Find the path to the input file
	or	ah, ah
	jne	.openinput
	pop	ecx
	or	ecx, ecx
	je near usage

.openinput:
	push	dword 0		; O_RDONLY
	push	ecx
	sys.open
	jc	near ierr		; open failed

	add	esp, byte 8
	mov	[fd.in], eax
	jmp	.arg

.p:
	cmp	al, 'p'
	jne	.c
	or	ah, ah
	jne	.pcheck

	pop	ecx
	or	ecx, ecx
	je	near usage

	mov	ah, [ecx]

.pcheck:
	cmp	ah, '0'
	jl	near usage
	cmp	ah, '9'
	ja	near usage
	mov	esi, ecx
	jmp	.arg

.c:
	cmp	al, 'c'
	jne	.b
	or	ah, ah
	jne	near usage
	mov	esi, connors
	jmp	.arg

.b:
	cmp	al, 'b'
	jne	.e
	or	ah, ah
	jne	near usage
	mov	esi, pinhole
	jmp	.arg

.e:
	cmp	al, 'e'
	jne	near usage
	or	ah, ah
	jne	near usage
	mov	al, ','
	mov	[huhmsg], al
	mov	[separ], al
	mov	[sep2], al
	mov	[sep3], al
	mov	[sep4], al
	jmp	.arg

align 4
.getenv:
	; If ESI = 0, we did not have a -p argument,
	; and need to check the environment for "PINHOLE="
	or	esi, esi
	jne	.init

	sub	ecx, ecx

.nextenv:
	pop	esi
	or	esi, esi
	je	.default	; no PINHOLE envar found

	; check if this envar starts with 'PINHOLE='
	mov	edi, envar
	mov	cl, 2		; 'PINHOLE=' is 2 dwords long
rep	cmpsd
	jne	.nextenv

	; Check if it is followed by a digit
	mov	al, [esi]
	cmp	al, '0'
	jl	.default
	cmp	al, '9'
	jbe	.init
	; fall through

align 4
.default:
	; We got here because we had no -p argument,
	; and did not find the PINHOLE envar.
	mov	esi, pinhole
	; fall through

align 4
.init:
	sub	eax, eax
	sub	ebx, ebx
	sub	ecx, ecx
	sub	edx, edx
	mov	edi, dbuffer+1
	mov	byte [dbuffer], '0'

	; Convert the pinhole constant to real
.constloop:
	lodsb
	cmp	al, '9'
	ja	.setconst
	cmp	al, '0'
	je	.processconst
	jb	.setconst

	inc	dl

.processconst:
	inc	cl
	cmp	cl, 18
	ja	near consttoobig
	stosb
	jmp	short .constloop

align 4
.setconst:
	or	dl, dl
	je	near perr

	finit
	fild	dword [tthou]

	fld1
	fild	dword [ten]
	fdivp	st1, st0

	fild	dword [thousand]
	mov	edi, obuffer

	mov	ebp, ecx
	call	bcdload

.constdiv:
	fmul	st0, st2
	loop	.constdiv

	fld1
	fadd	st0, st0
	fadd	st0, st0
	fld1
	faddp	st1, st0
	fchs

	; If we are creating a CSV file,
	; print header
	cmp	byte [separ], ','
	jne	.bigloop

	push	dword headlen
	push	dword header
	push	dword [fd.out]
	sys.write

.bigloop:
	call	getchar
	jc	near done

	; Skip to the end of the line if you got '#'
	cmp	al, '#'
	jne	.num
	call	skiptoeol
	jmp	short .bigloop

.num:
	; See if you got a number
	cmp	al, '0'
	jl	.bigloop
	cmp	al, '9'
	ja	.bigloop

	; Yes, we have a number
	sub	ebp, ebp
	sub	edx, edx

.number:
	cmp	al, '0'
	je	.number0
	mov	dl, 1

.number0:
	or	dl, dl		; Skip leading 0's
	je	.nextnumber
	push	eax
	call	putchar
	pop	eax
	inc	ebp
	cmp	ebp, 19
	jae	.nextnumber
	mov	[dbuffer+ebp], al

.nextnumber:
	call	getchar
	jc	.work
	cmp	al, '#'
	je	.ungetc
	cmp	al, '0'
	jl	.work
	cmp	al, '9'
	ja	.work
	jmp	short .number

.ungetc:
	dec	esi
	inc	ebx

.work:
	; Now, do all the work
	or	dl, dl
	je	near .work0

	cmp	ebp, 19
	jae	near .toobig

	call	bcdload

	; Calculate pinhole diameter

	fld	st0	; save it
	fsqrt
	fmul	st0, st3
	fld	st0
	fmul	st5
	sub	ebp, ebp

	; Round off to 4 significant digits
.diameter:
	fcom	st0, st7
	fstsw	ax
	sahf
	jb	.printdiameter
	fmul	st0, st6
	inc	ebp
	jmp	short .diameter

.printdiameter:
	call	printnumber	; pinhole diameter

	; Calculate F-number

	fdivp	st1, st0
	fld	st0

	sub	ebp, ebp

.fnumber:
	fcom	st0, st6
	fstsw	ax
	sahf
	jb	.printfnumber
	fmul	st0, st5
	inc	ebp
	jmp	short .fnumber

.printfnumber:
	call	printnumber	; F number

	; Calculate normalized F-number
	fmul	st0, st0
	fld1
	fld	st1
	fyl2x
	frndint
	fld1
	fscale
	fsqrt
	fstp	st1

	sub	ebp, ebp
	call	printnumber

	; Calculate time multiplier from F-5.6

	fscale
	fld	st0

	; Round off to 4 significant digits
.fmul:
	fcom	st0, st6
	fstsw	ax
	sahf

	jb	.printfmul
	inc	ebp
	fmul	st0, st5
	jmp	short .fmul

.printfmul:
	call	printnumber	; F multiplier

	; Calculate F-stops from 5.6

	fld1
	fxch	st1
	fyl2x

	sub	ebp, ebp
	call	printnumber

	mov	al, 0Ah
	call	putchar
	jmp	.bigloop

.work0:
	mov	al, '0'
	call	putchar

align 4
.toobig:
	call	huh
	jmp	.bigloop

align 4
done:
	call	write		; flush output buffer

	; close files
	push	dword [fd.in]
	sys.close

	push	dword [fd.out]
	sys.close

	finit

	; return success
	push	dword 0
	sys.exit

align 4
skiptoeol:
	; Keep reading until you come to cr, lf, or eof
	call	getchar
	jc	done
	cmp	al, 0Ah
	jne	.cr
	ret

.cr:
	cmp	al, 0Dh
	jne	skiptoeol
	ret

align 4
getchar:
	or	ebx, ebx
	jne	.fetch

	call	read

.fetch:
	lodsb
	dec	ebx
	clc
	ret

read:
	jecxz	.read
	call	write

.read:
	push	dword BUFSIZE
	mov	esi, ibuffer
	push	esi
	push	dword [fd.in]
	sys.read
	add	esp, byte 12
	mov	ebx, eax
	or	eax, eax
	je	.empty
	sub	eax, eax
	ret

align 4
.empty:
	add	esp, byte 4
	stc
	ret

align 4
putchar:
	stosb
	inc	ecx
	cmp	ecx, BUFSIZE
	je	write
	ret

align 4
write:
	jecxz	.ret	; nothing to write
	sub	edi, ecx	; start of buffer
	push	ecx
	push	edi
	push	dword [fd.out]
	sys.write
	add	esp, byte 12
	sub	eax, eax
	sub	ecx, ecx	; buffer is empty now
.ret:
	ret

align 4
bcdload:
	; EBP contains the number of chars in dbuffer
	push	ecx
	push	esi
	push	edi

	lea	ecx, [ebp+1]
	lea	esi, [dbuffer+ebp-1]
	shr	ecx, 1

	std

	mov	edi, bbuffer
	sub	eax, eax
	mov	[edi], eax
	mov	[edi+4], eax
	mov	[edi+2], ax

.loop:
	lodsw
	sub	ax, 3030h
	shl	al, 4
	or	al, ah
	mov	[edi], al
	inc	edi
	loop	.loop

	fbld	[bbuffer]

	cld
	pop	edi
	pop	esi
	pop	ecx
	sub	eax, eax
	ret

align 4
printnumber:
	push	ebp
	mov	al, [separ]
	call	putchar

	; Print the integer at the TOS
	mov	ebp, bbuffer+9
	fbstp	[bbuffer]

	; Check the sign
	mov	al, [ebp]
	dec	ebp
	or	al, al
	jns	.leading

	; We got a negative number (should never happen)
	mov	al, '-'
	call	putchar

.leading:
	; Skip leading zeros
	mov	al, [ebp]
	dec	ebp
	or	al, al
	jne	.first
	cmp	ebp, bbuffer
	jae	.leading

	; We are here because the result was 0.
	; Print '0' and return
	mov	al, '0'
	jmp	putchar

.first:
	; We have found the first non-zero.
	; But it is still packed
	test	al, 0F0h
	jz	.second
	push	eax
	shr	al, 4
	add	al, '0'
	call	putchar
	pop	eax
	and	al, 0Fh

.second:
	add	al, '0'
	call	putchar

.next:
	cmp	ebp, bbuffer
	jb	.done

	mov	al, [ebp]
	push	eax
	shr	al, 4
	add	al, '0'
	call	putchar
	pop	eax
	and	al, 0Fh
	add	al, '0'
	call	putchar

	dec	ebp
	jmp	short .next

.done:
	pop	ebp
	or	ebp, ebp
	je	.ret

.zeros:
	mov	al, '0'
	call	putchar
	dec	ebp
	jne	.zeros

.ret:
	ret

这段代码遵循了与我们之前看到的其他过滤器相同的格式，唯一的微妙例外是：

我们不再假设输入的结束意味着所有任务都已完成，这是在 面向字符 的过滤器中我们习以为常的做法。
这个过滤器不处理字符。它处理的是一种语言（尽管是一个非常简单的语言，仅由数字组成）。
当没有更多输入时，可能意味着两件事之一：
我们完成了，可以退出。这与之前相同。
我们读取的最后一个字符是一个数字。我们已经将它存储在我们的 ASCII 到浮点数转换缓冲区的末尾。现在，我们需要将该缓冲区的内容转换为一个数字，并写出最后一行输出。
因此，我们修改了 getchar 和 read 例程，使得在我们从输入中获取另一个字符时，carry flag 始终为清除，或者在没有更多输入时，carry flag 为设置。
当然，我们仍然使用汇编语言魔法来实现这一点！仔细看看 getchar。它总是在返回时将 carry flag 清除。
然而，我们的主代码依赖于 carry flag 来告诉它何时退出——并且它工作得很好。
这个魔法出现在 read 中。每当它从系统接收到更多输入时，它会返回到 getchar，getchar 从输入缓冲区获取一个字符，清除 carry flag 并返回。
但当 read 从系统接收到没有更多的输入时，它不会返回到 getchar。相反，add esp, byte 4 操作码将 4 加到 ESP 中，设置 carry flag 并返回。
那么，它返回到哪里呢？每当程序使用 call 操作码时，微处理器会将返回地址压入栈顶（即将其存储在系统栈中，而不是 FPU 栈中）。当程序使用 ret 操作码时，微处理器会从栈中弹出返回地址，并跳转到存储在该地址的地方。
但是，由于我们将 4 加到 ESP（栈指针寄存器），我们实际上给微处理器带来了轻微的 失忆症：它不再记得是 getchar 调用了 read。
由于 getchar 在调用 read 之前并没有压入任何内容，因此栈顶现在包含了调用 getchar 的程序的返回地址。就该调用者而言，它调用了 getchar，而 getchar 返回时将 carry flag 设置好了！

除此之外，bcdload 例程处于大端和小端之间的一个小冲突之中。

它正在将数字的文本表示转换为该数字：文本以大端顺序存储，但 打包的十进制 是小端顺序。

为了解决这个冲突，我们在开始时使用了 std 操作码。稍后我们使用 cld 来取消它：在 std 活跃时，我们非常重要的一点是不要调用任何可能依赖于 方向标志 默认设置的内容。

代码中的其他部分应该很清晰，前提是你已经阅读了之前的整个章节。

这是一个经典的例子，证明了编程需要大量的思考和很少的编码。只要我们将每个细节都考虑清楚，代码几乎就会自己写出来。

A.13.6. 使用针孔

由于我们决定让程序忽略除数字之外的任何输入（即使是在注释中的数字），我们实际上可以进行 文本查询。我们并不必须这样做，但我们可以这样做。

在我看来，进行文本查询，而不是必须遵循非常严格的语法，使得软件更加用户友好。

假设我们想要制作一台针孔相机，使用 4x5 英寸的胶片。对于这种胶片，标准的焦距大约是 150 毫米。我们希望微调焦距，使得针孔直径尽可能接近整数。我们还假设我们对相机比较熟悉，但对计算机有些许畏惧。与其直接输入一堆数字，我们更希望提出一些问题。

我们的会话可能如下所示：

% pinhole

Computer,

150 的焦距需要什么大小的针孔？
150    490    306    362    2930    12
嗯……那 160 呢？
160    506    316    362    3125    12
那我们设为 155 吧。
155    498    311    362    3027    12
啊，试试 157 吧……
157    501    313    362    3066    12
156 呢？
156    500    312    362    3047    12
就是这个！完美！非常感谢！
^D

我们发现，虽然对于焦距为 150 毫米时，针孔直径应该是 490 微米，或者 0.49 毫米，但如果我们选择几乎相同的焦距 156 毫米，我们就可以将针孔直径设为恰好半毫米。

A.13.7. 脚本编写

由于我们选择了 # 字符来表示注释的开始，我们可以将我们的针孔软件视为一个 脚本语言。

你可能见过以以下方式开始的 shell 脚本：

#! /bin/sh

… 或者 …

#!/bin/sh

因为 #! 后的空格是可选的。

每当 UNIX® 被要求运行一个以 #! 开头的可执行文件时，它会假定该文件是一个脚本。它将命令与脚本的第一行剩余部分结合起来，并尝试执行。

假设我们现在将针孔程序安装在 /usr/local/bin/ 目录下，我们现在可以编写一个脚本，用来计算适合 120 胶片常用的各种焦距的针孔直径。

这个脚本可能看起来像这样：

#! /usr/local/bin/pinhole -b -i
# 查找最佳的针孔直径
# 适用于 120 胶片

### 标准焦距
80

### 广角
30, 40, 50, 60, 70

### 长焦
100, 120, 140

由于 120 胶片是一种中等大小的胶片，我们可以将此文件命名为 medium。我们可以设置它的执行权限，并像运行程序一样运行它：

% chmod 755 medium
% ./medium

UNIX® 会将最后一个命令解释为：

% /usr/local/bin/pinhole -b -i ./medium

它将运行该命令并显示：

80    358    224    256    1562    11
30    219    137    128    586     9
40    253    158    181    781     10
50    283    177    181    977     10
60    310    194    181    1172    10
70    335    209    181    1367    10
100   400    250    256    1953    11
120   438    274    256    2344    11
140   473    296    256    2734    11

现在，我们输入：

% ./medium -c

UNIX® 会将其视为：

% /usr/local/bin/pinhole -b -i ./medium -c

这会给它两个冲突的选项：-b 和 -c（使用 Bender 常数和使用 Connors 常数）。我们已经编程使得后面的选项覆盖前面的选项——我们的程序将使用 Connors 常数来计算所有内容：

80    331    242    256    1826    11
30    203    148    128    685     9
40    234    171    181    913     10
50    262    191    181    1141    10
60    287    209    181    1370    10
70    310    226    256    1598    11
100   370    270    256    2283    11
120   405    296    256    2739    11
140   438    320    362    3196    12

我们决定还是使用 Bender 常数。我们想将其值保存为逗号分隔的文件：

% ./medium -b -e > bender
% cat bender
focal length in millimeters,pinhole diameter in microns,F-number,normalized F-number,F-5.6 multiplier,stops from F-5.6
80,358,224,256,1562,11
30,219,137,128,586,9
40,253,158,181,781,10
50,283,177,181,977,10
60,310,194,181,1172,10
70,335,209,181,1367,10
100,400,250,256,1953,11
120,438,274,256,2344,11
140,473,296,256,2734,11
%

A.14. 注意事项

在 MS-DOS® 和 Windows® 下“成长”的汇编语言程序员通常倾向于走捷径。读取键盘扫描码和直接写入视频内存是两个经典的做法，在 MS-DOS® 下，这些做法并不被批评，而是被认为是正确的做法。

原因是什么？因为在执行这些操作时，PC BIOS 和 MS-DOS® 是非常慢的。

你可能会想继续在 UNIX® 环境中采用类似的做法。例如，我曾看到一个网站，解释如何在一个流行的 UNIX® 克隆系统中访问键盘扫描码。

但这通常是在 UNIX® 环境中 非常糟糕的做法！让我解释一下为什么。

A.14.1. UNIX® 是受保护的

首先，可能根本不可能这样做。UNIX® 运行在受保护模式下，只有内核和设备驱动程序才允许直接访问硬件。也许某个特定的 UNIX® 克隆系统会让你读取键盘扫描码，但一个真正的 UNIX® 操作系统很可能不会。而且即使某个版本允许这样做，下一版本可能就不允许了，所以你精心编写的软件可能会一夜之间变得过时。

A.14.2. UNIX® 是一种抽象

但是，还有一个更重要的原因，不要试图直接访问硬件（除非，当然，你正在编写设备驱动程序），即使在允许你这样做的 UNIX® 类系统中：

UNIX® 是一种抽象！

MS-DOS® 和 UNIX® 在设计哲学上有一个根本的区别。MS-DOS® 被设计为一个单用户系统，运行在配有键盘和视频显示器的计算机上。用户输入几乎可以保证来自该键盘。你的程序输出几乎总是显示在该屏幕上。

而在 UNIX® 下，这一点从来没有被保证。UNIX® 用户很常见的做法是管道和重定向程序的输入和输出：

% program1 | program2 | program3 > file1

如果你编写了 program2，你的输入就不是来自键盘，而是来自 program1 的输出。同样，你的输出也不是显示在屏幕上，而是成为 program3 的输入，后者的输出最终被写入 file1。

而且还有更多！即使你确保了输入来自终端，输出也去往终端，但终端也不一定是 PC：它可能没有你期望的那种视频内存，或者它的键盘也可能不是生产 PC 风格扫描码的键盘。它可能是 Macintosh®，或者任何其他计算机。

现在你可能会摇头想：我的软件是用 PC 汇编语言编写的，怎么能在 Macintosh® 上运行？但我并不是说你的软件会在 Macintosh® 上运行，我只是说它的终端可能是一个 Macintosh®。

在 UNIX® 下，终端不一定要直接连接到运行你软件的计算机，它甚至可能位于另一个大陆，或者，事实上，可能在另一个星球上。完全有可能一个澳大利亚的 Macintosh® 用户通过 telnet 连接到位于北美（或其他地方）的 UNIX® 系统。此时，软件在一台计算机上运行，而终端则位于另一台计算机上：如果你试图读取扫描码，你将得到错误的输入！

关于任何其他硬件也是一样：你正在读取的文件可能存储在你无法直接访问的磁盘上。你正在读取图像的相机可能位于太空飞船上，通过卫星与你连接。

这就是为什么在 UNIX® 下，你永远不应假设你的数据来自哪里、去向哪里。始终让系统处理对硬件的物理访问。

注意
这些是注意事项，而不是绝对规则。也可能存在例外。例如，如果一个文本编辑器确定它正在本地计算机上运行，它可能希望直接读取扫描码以提高控制精度。我提到这些注意事项并不是告诉你该做什么或不该做什么，而是让你意识到，如果你刚从 MS-DOS® 转到 UNIX®，可能会遇到的一些陷阱。当然，创造性的人通常会打破规则，只要他们知道自己在打破规则，并且理解原因，这是可以接受的。

A.15. 致谢

Jake Burkholder 则通过愿意回答我的所有问题，并提供示例汇编语言源代码，继续为我打开这扇大门。

第 8 章 IPv6 内部实现

8.1. IPv6/IPsec 实现

8.1.1. IPv6

8.1.1.1. 标准遵循情况

与 IPv6 相关的功能符合，或尽量符合最新的 IPv6 标准。为了将来参考，我们在下方列出一些相关文档（注意：这不是完整列表 —— 太难维护了……）。

如需详细信息，请参阅文档中相应章节、RFC、手册页或源代码中的注释。

RFC1639：FTP 在大地址记录上的操作（FOOBAR）
- 推荐使用 RFC2428 代替 RFC1639。FTP 客户端会首先尝试 RFC2428，失败后才尝试 RFC1639。
RFC1886：支持 IPv6 的 DNS 扩展
RFC1933：IPv6 主机与路由器的过渡机制
- 不支持 IPv4 兼容地址。
- 不支持自动隧道（RFC 第 4.3 节中描述）。
RFC1981：IPv6 的路径 MTU 发现
RFC2080：IPv6 的 RIPng
- usr.sbin/route6d 提供支持。
RFC2292：IPv6 的高级套接字 API
- 有关支持的库函数/内核 API，请见 sys/netinet6/ADVAPI。
RFC2362：协议无关多播 - 稀疏模式（PIM-SM）
- RFC2362 定义了 PIM-SM 的数据包格式。draft-ietf-pim-ipv6-01.txt 基于此撰写。
RFC2373：IPv6 地址结构
- 支持节点所需地址，并符合作用域要求。
RFC2374：IPv6 可聚合全局单播地址格式
- 支持 64 位接口 ID 长度。
RFC2375：IPv6 多播地址分配
- 用户空间应用程序使用 RFC 中分配的知名地址。
RFC2428：IPv6 和 NAT 的 FTP 扩展
- 推荐使用 RFC2428 代替 RFC1639。FTP 客户端会首先尝试 RFC2428，失败后再尝试 RFC1639。
RFC2460：IPv6 规范
RFC2461：IPv6 邻居发现
RFC2462：IPv6 无状态地址自动配置
RFC2463：IPv6 的 ICMPv6 规范
RFC2464：以太网上的 IPv6 分组传输
RFC2465：IPv6 的 MIB：文本约定与常规组
- 所需统计数据由内核收集。实际的 IPv6 MIB 支持通过 ucd-snmp 补丁包提供。
RFC2466：IPv6 的 MIB：ICMPv6 组
- 所需统计数据由内核收集。实际的 IPv6 MIB 支持通过 ucd-snmp 补丁包提供。
RFC2467：FDDI 网络上的 IPv6 分组传输
RFC2497：ARCnet 网络上的 IPv6 分组传输
RFC2553：IPv6 的基本套接字接口扩展
RFC2675：IPv6 Jumbo 报文
RFC2710：IPv6 的多播监听器发现（MLD）
RFC2711：IPv6 路由器提醒选项
draft-ietf-ipngwg-router-renum-08：IPv6 路由器重新编号
draft-ietf-ipngwg-icmp-namelookups-02：通过 ICMP 的 IPv6 名称查询
draft-ietf-ipngwg-icmp-name-lookups-03：通过 ICMP 的 IPv6 名称查询
draft-ietf-pim-ipv6-01.txt：IPv6 的 PIM
draft-itojun-ipv6-tcp-to-anycast-00：断开面向 IPv6 Anycast 地址的 TCP 连接
draft-yamamoto-wideipv6-comm-model-00
draft-ietf-ipngwg-scopedaddr-format-00.txt：IPv6 作用域地址格式扩展

8.1.1.2. 邻居发现

邻居发现相当稳定。目前支持地址解析、重复地址检测（DAD）和邻居不可达检测。近期我们将会向内核中添加代理邻居通告支持，并提供无请求邻居通告的发送命令，作为管理员工具。

部分网络驱动在混杂模式下会将多播数据包回送给自身，即使指示不要这样做。在这种情况下，DAD 可能会失败，因为 DAD 引擎会看到来自本节点的 NS 入站数据包，并将其视为重复地址的信号。你可以查看 sys/netinet6/nd6_nbr.c 文件中的 nd6_dad_timer() 函数里用 #if 标记为“heuristics”的代码作为变通方案（注意，“heuristics”部分的代码不符合规范）。

邻居发现规范（RFC2461）没有说明以下情况中邻居缓存的处理方式：

尚无邻居缓存条目时，节点收到未携带链路层地址的未经请求的 RS/NS/NA/重定向数据包；
在无链路层地址的介质上如何处理邻居缓存（我们仍需要邻居缓存条目来存储 IsRouter 位）。

对于第一种情况，我们根据 IETF ipngwg 邮件列表中的讨论实现了一个变通方案。详情见源代码中的注释和邮件列表中从 1999 年 2 月 6 日（IPng 7155）开始的讨论线程。

IPv6 的“链路内”判断规则（RFC2461）与 BSD 网络代码中的假设大相径庭。目前尚不支持默认路由器列表为空时的“链路内”判断规则（RFC2461，第 5.2 节，第 2 段最后一句 —— 请注意，该规范在多个地方混用了“host”和“node”的含义）。

为避免可能的 DoS 攻击与无限循环，我们目前仅接受 ND 数据包中的前 10 个选项。因此，如果 RA 附带了 20 个前缀选项，只有前 10 个会被识别。如果这对你造成困扰，请在 FREEBSD-CURRENT 邮件列表中提出，或自行修改 sys/netinet6/nd6.c 中的 nd6_maxndopt 变量。如果用户需求足够强烈，我们也可能为此变量提供 sysctl 控制项。

8.1.1.3. 作用域索引（Scope Index）

IPv6 使用具有限定作用域的地址。因此，在使用 IPv6 地址时，指定作用域索引（对于链路本地地址是接口索引，对于站点本地地址是站点索引）非常重要。如果没有作用域索引，具有限定作用域的 IPv6 地址对于内核来说是模糊的，内核将无法确定数据包的出接口。

普通的用户态应用程序应该使用高级 API（RFC2292）来指定作用域索引或接口索引。为实现类似目的，RFC2553 在 sockaddr_in6 结构中定义了 sin6_scope_id 成员。然而，sin6_scope_id 的语义相当模糊。如果你关心应用程序的可移植性，我们建议你使用高级 API 而不是 sin6_scope_id。

在内核中，对于链路本地作用域的地址，接口索引嵌入在 IPv6 地址的第二个 16 位字（即第 3 和第 4 字节）中。例如，你可能会在路由表和接口地址结构（struct in6_ifaddr）中看到如下形式的地址：

fe80:1::200:f8ff:fe01:6317

上面的地址是一个链路本地单播地址，属于接口标识符为 1 的网络接口。嵌入索引的方式使我们能够在多个接口上有效地识别 IPv6 链路本地地址，同时只需很少的代码修改。

当你在命令行中指定具有作用域的地址时，切勿使用嵌入形式（例如 ff02:1::1 或 fe80:2::fedc）。这是不应该被支持的。应始终使用标准形式，如 ff02::1 或 fe80::fedc，并使用命令行选项指定接口（如 ping -6 -I ne0 ff02::1）。一般而言，如果某个命令没有用于指定出接口的命令行选项，那么它尚未准备好处理具有作用域的地址。这似乎与 IPv6 支持“牙医办公室”（dentist office）情形的初衷相悖。我们认为这些规范仍需改进。

部分用户态工具支持扩展的 IPv6 数值语法，如 draft-ietf-ipngwg-scopedaddr-format-00.txt 中所述。你可以通过使用出接口的名称来指定出链路，例如 fe80::1%ne0。通过这种方式，你可以轻松指定链路本地作用域地址。

8.1.1.4. 即插即用（Plug and Play）

大多数 IPv6 的无状态地址自动配置功能是在内核中实现的。邻居发现（Neighbor Discovery）功能整体上由内核实现。主机端对路由通告（RA）的输入在内核中实现；终端主机的路由请求（RS）输出、路由器的 RS 输入和 RA 输出则在用户态中实现。

8.1.1.4.1. 链路本地地址和特殊地址的分配

IPv6 的链路本地地址是根据 IEEE802 地址（即以太网 MAC 地址）生成的。当接口变为激活状态（IFF_UP）时，会自动分配 IPv6 链路本地地址。同时，会将链路本地地址的直接路由加入路由表。

以下是 netstat 命令的输出示例：

Internet6:
Destination                   Gateway                   Flags      Netif Expire
fe80:1::%ed0/64               link#1                    UC          ed0
fe80:2::%ep0/64               link#2                    UC          ep0

对于没有 IEEE802 地址的接口（如隧道接口或 ppp 接口等伪接口），将尽可能借用其他接口（如以太网接口）的 IEEE802 地址。如果没有任何 IEEE802 硬件可用，则会以 MD5(主机名) 的伪随机值作为链路本地地址的来源作为最后手段。如果这种方式不适用于你的需求，你需要手动配置链路本地地址。

如果某个接口无法处理 IPv6（如不支持多播），则不会为该接口分配链路本地地址。详情请参见第 2 节。

每个接口都会加入 solicited 多播地址和链路本地 all-nodes 多播地址（例如接口所在链路上的 fe80::1:ff01:6317 和 ff02::1）。除了链路本地地址外，还会将环回地址（::1）分配给环回接口。同时，::1/128 和 ff01::/32 会自动添加到路由表中，环回接口也会加入节点本地多播组 ff01::1。

8.1.1.4.2. 主机上的无状态地址自动配置

在 IPv6 规范中，节点分为两类：路由器（router） 和 主机（host）。路由器转发目的地为其他节点的数据包，主机则不转发数据包。net.inet6.ip6.forwarding 控制该节点的角色（若为 1 则为路由器，若为 0 则为主机）。

请注意，IPv6 规范默认以下前提条件，对于不符合这些前提的情况，规范未做详细定义：

只有主机会监听路由通告；
主机仅有一个网络接口（不包括环回接口）。

因此，不建议在路由器或多接口主机上启用 net.inet6.ip6.accept_rtadv。配置错误的节点可能会表现异常（对于想做实验的人来说，这种非规范配置是允许的）。

以下是 sysctl 控制选项的总结：

accept_rtadv	forwarding	节点角色
-----------	-----------	-----------------------
0		0		主机（需手动配置）
0		1		路由器
1		0		自动配置主机
				（规范假定主机仅有一个接口；
				 多接口自动配置主机超出规范范围）
1		1		无效或实验用途
				（超出规范范围）

RFC2462 第 5.5.3 (e) 节对收到的 RA 中前缀信息选项规定了验证规则，以防止主机受到恶意（或配置错误）的路由器发送极短的前缀生命周期影响。Jim Bound 曾在 ipngwg 邮件列表中提出一项更新（可在归档中查找 “(ipng 6712)”），此更新已被实现。

8.1.1.5. 通用隧道接口

v6 封装于 v6（v6 in v6）
v6 封装于 v4（v6 in v4）
v4 封装于 v6（v4 in v6）
v4 封装于 v4（v4 in v4）

8.1.1.6. 源地址选择

当前的源地址选择规则是基于作用域（scope）优先的（但也有一些例外，见下文）。对于一个给定的目的地址，IPv6 源地址的选择遵循以下规则：

如果用户显式指定了源地址（例如通过高级 API），则使用指定的地址。
如果出口接口（通常通过查询路由表确定）上分配有与目的地址具有相同作用域的地址，则使用该地址。这是最常见的情况。
如果没有符合上述条件的地址，则选择发送节点的任一接口上分配的全局地址。
如果仍没有符合条件的地址，且目的地址是站点本地（site local）作用域，则选择任一接口上分配的站点本地地址。
如果仍无法满足条件，则选择与目标地址的路由表项相关联的地址。此为最后手段，可能导致作用域违规。

需要注意的是，上述规则未在 IPv6 规范中定义，属于“由实现决定”的项目。以下是一些不遵循上述规则的情况：例如建立 TCP 连接时，会使用保存在 tcb 中的地址作为源地址；再如发送邻居通告（Neighbor Advertisement）时，规范（RFC2461 第 7.2.2 节）要求 NA 的源地址为对应 NS 的目标地址。在这种情况下我们遵循规范，而非最长匹配规则。

对于新连接（规则 1 不适用的情况），如果存在已弃用的地址（preferred lifetime = 0），则在其他地址可用时不会选取它们作为源地址；若无其他选择，则会作为最后手段使用。如果存在多个可用的已弃用地址，将依照上述作用域规则选择其中之一。若你希望禁止使用已弃用的地址，可将 sysctl 参数 net.inet6.ip6.use_deprecated 设置为 0。与已弃用地址相关的问题详见 RFC2462 第 5.5.4 节（注意：IETF ipngwg 正在讨论如何使用“已弃用”地址）。

8.1.1.7. 巨大负载（Jumbo Payload）

已实现了巨大负载跳跃式选项（Jumbo Payload hop-by-hop option），可以用于发送负载大于 65,535 字节的 IPv6 数据包。但目前没有支持超过 65,535 字节 MTU 的物理接口，因此此类负载仅能在环回接口（即 lo0）上看到。

如果你希望尝试巨大负载，首先需要重新配置内核，使环回接口的 MTU 大于 65,535 字节；在内核配置文件中添加以下内容：

options "LARGE_LOMTU" # 测试巨大负载

然后重新编译新内核。

% ping -6 -b 70000 -s 68000 ::1

IPv6 规范要求，如果数据包中携带了分片头，则不得使用巨大负载选项。如果违反此规定，必须向发送方发送 ICMPv6 参数问题消息。尽管规范如此，但通常无法看到由于此要求引发的 ICMPv6 错误。

% netstat -s -p ip6
	  ip6:
		(省略)
		1 with data size < data length

因此，内核不会发送 ICMPv6 错误，除非数据包确实是一个巨大负载，即其包大小大于 65,535 字节。如上所述，目前没有支持如此大 MTU 的物理接口，因此 ICMPv6 错误的返回几乎不可能发生。

目前不支持在巨大负载（jumbogram）上使用 TCP/UDP。这是因为除了环回接口外，我们没有其他介质来进行测试。如果你有此需求，请联系我们。

IPsec 不支持巨大负载。这是因为在支持 AH（认证头）与巨大负载时存在一些规范上的问题（AH 头大小影响负载长度，这使得认证传入数据包时处理巨大负载选项以及 AH 变得非常困难）。

在 *BSD 系统中，支持巨大负载存在一些根本性问题。我们希望解决这些问题，但需要更多时间来完成。列举几个问题：

在 4.4BSD 中，mbuf 的 pkthdr.len 字段被定义为“int”，因此它无法在 32 位架构的 CPU 上保存大于 2G 的巨大负载。如果我们希望正确支持巨大负载，必须扩展该字段以支持 4G + IPv6 头 + 链路层头。因此，该字段必须扩展为至少 int64_t（u_int32_t 不足够）。
我们错误地在许多地方使用“int”来保存数据包长度。需要将它们转换为更大的整数类型，这需要非常小心，因为在数据包长度计算过程中可能会发生溢出。
我们错误地在多个地方检查 IPv6 头的 ip6_plen 字段来确定数据包负载长度。实际上应检查 mbuf 的 pkthdr.len。ip6_input() 会在输入时对巨大负载选项进行合理性检查，之后我们可以安全地使用 mbuf 的 pkthdr.len。
当然，TCP 代码也需要在许多地方进行仔细更新。

8.1.1.8. 头部处理中的循环防止

IPv6 规范允许将任意数量的扩展头添加到数据包中。如果我们按照 BSD 的 IPv4 代码实现 IPv6 数据包处理，内核堆栈可能会因为长时间的函数调用链而导致溢出。sys/netinet6 代码经过精心设计，避免了内核堆栈溢出，因此 sys/netinet6 代码定义了自己的协议切换结构，即 "struct ip6protosw"（参见 netinet6/ip6protosw.h）。IPv4 部分（sys/netinet）没有进行类似的更新以保持兼容性，但它对 pr_input() 原型进行了小幅修改。因此，"struct ipprotosw" 也被定义了。结果是，如果接收到带有大量 IPsec 头的 IPsec-over-IPv4 数据包，内核堆栈可能会溢出。但 IPsec-over-IPv6 是安全的。（当然，为了处理这些 IPsec 头，每个 IPsec 头必须通过每个 IPsec 检查，因此匿名攻击者无法利用这种攻击。）

8.1.1.9. ICMPv6

RFC2463 发布后，IETF ipngwg 决定禁止对 ICMPv6 重定向消息发送 ICMPv6 错误数据包，以防止网络介质上发生 ICMPv6 风暴。此项已在内核中实现。

8.1.1.10. 应用程序

对于用户空间编程，我们支持 IPv6 套接字 API，符合 RFC2553、RFC2292 和即将发布的互联网草案。

8.1.1.11. 内核内部

虽然 ip_forward() 调用 ip_output()，但 ip6_forward() 直接调用 if_output()，因为路由器不应将 IPv6 数据包分割成分片。

ICMPv6 应尽可能包含原始数据包，直到 1280 字节。例如，UDP6/IP6 端口不可达错误应该包含所有扩展头和 未修改 的 UDP6 和 IP6 头。因此，除了 TCP 之外，所有 IP6 函数都不会将网络字节序转换为主机字节序，以保留原始数据包。

tcp_input()、udp6_input() 和 icmp6_input() 不能假设 IP6 头部紧接着传输层头部，因为存在扩展头。因此，in6_cksum() 被实现用于处理 IP6 头部和传输头部不连续的数据包。TCP/IP6 和 UDP6/IP6 头结构并不存在于校验和计算中。

为了便于处理 IP6 头部、扩展头部和传输头部，网络驱动程序现在要求将数据包存储在一个内部 mbuf 或一个或多个外部 mbuf 中。旧版驱动程序通常为 96 - 204 字节的数据准备两个内部 mbuf，但现在这类数据包数据会存储在一个外部 mbuf 中。

netstat -s -p ip6 命令可以告诉你你的驱动程序是否符合这一要求。在下面的例子中，"cce0" 不符合要求。（更多信息，请参阅第 2 节。）

Mbuf statistics:
                317 one mbuf
                two or more mbuf::
                        lo0 = 8
			cce0 = 10
                3282 one ext mbuf
                0 two or more ext mbuf

每个输入函数在开始时调用 IP6_EXTHDR_CHECK 来检查 IP6 头与其扩展头之间的区域是否连续。如果 mbuf 设置了 M_LOOP 标志，即数据包来自环回接口，则 IP6_EXTHDR_CHECK 会调用 m_pullup()；否则，来自物理网络接口的数据包则不会调用 m_pullup()。

IP 和 IP6 的重组函数都不会调用 m_pullup()。

8.1.1.12. IPv4 映射地址与 IPv6 通配符套接字

RFC2553 描述了 IPv4 映射地址（3.7）和 IPv6 通配符绑定套接字的特殊行为（3.8）。该规范允许你：

通过 AF_INET6 通配符绑定套接字接收 IPv4 连接。
通过使用类似 ::ffff:10.1.1.1 这样的地址格式，通过 AF_INET6 套接字传输 IPv4 数据包。

但该规范本身非常复杂，并未明确指定套接字层应该如何处理。我们在此将前者称为“监听端”，将后者称为“发起端”，以供参考。

你可以在同一个端口上对两个地址族进行通配符绑定。

下表展示了 FreeBSD 4.x 的行为：

listening side          initiating side
                (AF_INET6 wildcard      (connection to ::ffff:10.1.1.1)
                socket gets IPv4 conn.)
                ---                     ---
FreeBSD 4.x     configurable            supported
                default: enabled

接下来的章节将提供更多详细信息，以及如何配置这些行为。

关于监听端的注释：

如果一个服务器应用程序希望同时接受 IPv4 和 IPv6 连接，则有两种选择。

为了便于便捷地仅支持 IPv6 流量，使用 AF_INET6 通配符绑定套接字时，始终在连接建立时检查对端地址。如果地址是 IPv4 映射地址，你可能希望拒绝该连接。你可以通过使用 IN6_IS_ADDR_V4MAPPED() 宏来检查这一条件。

int on;

	setsockopt(s, IPPROTO_IPV6, IPV6_BINDV6ONLY,
		   (char *)&on, sizeof (on)) < 0));

当此调用成功时，套接字将仅接收 IPv6 数据包。

8.1.1.12.1. 发起端的注释

建议应用程序实现者：为了实现一个可移植的 IPv6 应用程序（在多个 IPv6 内核上工作），我们认为以下几点是成功的关键：

永远不要硬编码 AF_INET 或 AF_INET6。

在编写需要发起连接的应用程序时，如果你将 AF_INET 和 AF_INET6 视为完全独立的地址族，事情会变得更简单。{set,get}sockopt 问题会更简单，DNS 问题也会简化。我们不建议依赖 IPv4 映射地址。

8.1.1.12.1. 统一的 TCP 和 inpcb 代码

FreeBSD 4.x 在 IPv4 和 IPv6 之间共享 TCP 代码（来自 sys/netinet/tcp*），并分开处理 UDP4/6 代码。它使用统一的 inpcb 结构。

该平台可以配置为支持 IPv4 映射地址。内核配置总结如下：

默认情况下，AF_INET6 套接字将在某些条件下接管 IPv4 连接，并且可以发起到嵌入在 IPv4 映射 IPv6 地址中的 IPv4 目标的连接。
你可以通过 sysctl 禁用整个系统的 IPv4 映射地址，方法如下：sysctl net.inet6.ip6.mapped_addr=0

8.1.1.12.1.1. 监听端

int on;

	setsockopt(s, IPPROTO_IPV6, IPV6_BINDV6ONLY,
		   (char *)&on, sizeof (on)) < 0));

只有在以下条件满足时，通配符 AF_INET6 套接字才会接管 IPv4 连接：

没有与 IPv4 连接匹配的 AF_INET 套接字。
AF_INET6 套接字配置为接受 IPv4 流量，即 getsockopt(IPV6_BINDV6ONLY) 返回 0。

打开/关闭顺序没有问题。

8.1.1.12.1.2. 发起端

FreeBSD 4.x 支持向 IPv4 映射地址（::ffff:10.1.1.1）发起连接，如果节点配置为支持 IPv4 映射地址。

8.1.1.13. sockaddr_storage

当 RFC2553 即将定稿时，关于如何命名 struct sockaddr_storage 成员有过讨论。一个提案是将 * 前缀加到成员名上（例如“*ss_len”），因为它们不应被直接修改。另一个提案是不加前缀（例如“ss_len”），因为我们需要直接操作这些成员。对此没有明确的共识。

因此，RFC2553 定义了 struct sockaddr_storage 如下：

struct sockaddr_storage {
		u_char	__ss_len;	/* 地址长度 */
		u_char	__ss_family;	/* 地址族 */
		/* 一堆填充 */
	};

相反，XNET 草案定义如下：

struct sockaddr_storage {
		u_char	ss_len;		/* 地址长度 */
		u_char	ss_family;	/* 地址族 */
		/* 一堆填充 */
	};

在 1999 年 12 月，达成了一致意见，RFC2553bis 应该采纳后者（XNET）定义。

当前实现遵循 XNET 定义，基于 RFC2553bis 的讨论。

如果你查看多个 IPv6 实现，你会看到这两种定义。作为用户空间程序员，处理它的最便捷方式是：

确保平台上有 ss_family 和/或 ss_len，可以使用 GNU autoconf，
使用 -Dss_family=*ss_family 统一所有实例（包括头文件）为 *ss_family，或者
永远不要触碰 __ss_family，将其转换为 sockaddr * 并使用 sa_family，如：
```
struct sockaddr_storage ss;
	family = ((struct sockaddr *)&ss)->sa_family;
```

8.1.2. 网络驱动程序

以下两个项目是标准驱动程序需要支持的：

mbuf 聚类要求。在这个稳定版本中，我们将 MINCLSIZE 改为 MHLEN+1，以便所有操作系统的驱动程序都能按照预期行为工作。

（注意：过去我们要求所有 PCMCIA 驱动程序必须调用 in6_ifattach()。现在我们不再有这样的要求。）

8.1.3. 翻译器

我们将 IPv4/IPv6 翻译器分为四种类型：

翻译器 A --- 用于过渡的早期阶段，使得 IPv6 主机能够在 IPv6 网络中与 IPv4 主机建立连接。
翻译器 B --- 用于过渡的早期阶段，使得 IPv4 主机能够在 IPv4 网络中与 IPv6 主机建立连接。
翻译器 C --- 用于过渡的后期阶段，使得 IPv4 主机能够在 IPv4 网络中与 IPv6 主机建立连接。
翻译器 D --- 用于过渡的后期阶段，使得 IPv6 主机能够在 IPv6 网络中与 IPv4 主机建立连接。

8.1.4. IPsec

IPsec 主要由三个组件组成：

策略管理
密钥管理
AH 和 ESP 处理

8.1.4.1. 策略管理

策略条目不会与其索引重新排序，因此添加条目的顺序非常重要。

8.1.4.2. 密钥管理

该工具包（sys/netkey）实现的密钥管理代码是一个自制的 PFKEY v2 实现，符合 RFC2367。

自制的 IKE 守护进程 "racoon" 包含在该工具包中（kame/kame/racoon）。基本上，你需要将 racoon 作为守护进程运行，然后设置一个策略以要求密钥（如 ping -P 'out ipsec esp/transport//use'）。内核将在必要时联系 racoon 守护进程以交换密钥。

8.1.4.3. AH 和 ESP 处理

IPsec 模块作为标准 IPv4/IPv6 处理的“钩子”实现。当发送数据包时，ip{,6}_output() 会检查是否需要 ESP/AH 处理，通过检查是否找到匹配的 SPD（安全策略数据库）。如果需要 ESP/AH，{esp,ah}{4,6}_output() 会被调用，并且 mbuf 将相应更新。当数据包接收时，{esp,ah}4_input() 会根据协议号（即 (*inetsw[proto])()）被调用。{esp,ah}4_input() 会解密/检查数据包的真实性，并去除 ESP/AH 的链式头部和填充。由于我们在接收时不会直接使用收到的数据包，因此去除 ESP/AH 头部是安全的。

通过使用 ESP/AH，TCP4/6 的有效数据段大小将受到 ESP/AH 插入的额外链式头部的影响。我们的代码已经处理了这一情况。

基本的加密功能可以在 "sys/crypto" 目录中找到。ESP/AH 转换列在 {esp,ah}_core.c 文件中，包含包装函数。如果你希望添加某个算法，可以在 {esp,ah}_core.c 中添加包装函数，并将加密算法代码加入 sys/crypto。

隧道模式在本版本中部分支持，具有以下限制：

IPsec 隧道不能与 GIF 泛型隧道接口结合使用。需要特别小心，因为我们可能会在 ip_output() 和 tunnelifp→if_output() 之间创建一个无限循环。关于是否统一它们，意见不一。
MTU 和不分段位（IPv4）需要更多的检查，但基本上可以正常工作。
AH 隧道的身份验证模型需要重新审视。最终，我们需要改进策略管理引擎。

8.1.4.4. 遵循 RFC 和 ID 的一致性

内核中的 IPsec 代码符合（或尽力符合）以下标准：

“旧版 IPsec”规范在 rfc182[5-9].txt 中有文档说明。

当前支持的算法有：

旧版 IPsec AH
- 空加密校验和（无文档，仅用于调试）
- 使用 128 位加密校验和的键控 MD5（rfc1828.txt）
- 使用 128 位加密校验和的键控 SHA1（无文档）
- 使用 128 位加密校验和的 HMAC MD5（rfc2085.txt）
- 使用 128 位加密校验和的 HMAC SHA1（无文档）
旧版 IPsec ESP
- 空加密（无文档，类似于 rfc2410.txt）
- DES-CBC 模式（rfc1829.txt）
新版 IPsec AH
- 空加密校验和（无文档，仅用于调试）
- 使用 96 位加密校验和的键控 MD5（无文档）
- 使用 96 位加密校验和的键控 SHA1（无文档）
- 使用 96 位加密校验和的 HMAC MD5（rfc2403.txt）
- 使用 96 位加密校验和的 HMAC SHA1（rfc2404.txt）
新版 IPsec ESP
- 空加密（rfc2410.txt）
- 使用派生 IV 的 DES-CBC（draft-ietf-ipsec-ciph-des-derived-01.txt，草案已过期）
- 使用显式 IV 的 DES-CBC（rfc2405.txt）
- 使用显式 IV 的 3DES-CBC（rfc2451.txt）
- BLOWFISH CBC（rfc2451.txt）
- CAST128 CBC（rfc2451.txt）
- RC5 CBC（rfc2451.txt）
- 以上每种都可以与以下认证组合使用：
  - 使用 HMAC-MD5(96bit) 的 ESP 身份验证
  - 使用 HMAC-SHA1(96bit) 的 ESP 身份验证

不支持的算法：

旧版 IPsec AH
- 使用 128 位加密校验和 + 64 位重放防止的 HMAC MD5（rfc2085.txt）
- 使用 160 位加密校验和 + 32 位填充的键控 SHA1（rfc1852.txt）

IPsec（内核中）和 IKE（作为用户空间的“racoon”）已在多个互操作性测试活动中进行了测试，并且已知与许多其他实现良好互操作。此外，目前的 IPsec 实现覆盖了 RFC 中文档化的 IPsec 加密算法（仅涵盖没有知识产权问题的算法）。

8.1.4.5. IPsec 隧道中的 ECN 考虑

如 draft-ipsec-ecn-00.txt 中所述，支持 ECN 友好的 IPsec 隧道。

正常的 IPsec 隧道在 RFC2401 中有描述。在封装时，IPv4 TOS 字段（或 IPv6 流量类别字段）将从内层 IP 头复制到外层 IP 头。在解封装时，外层 IP 头将被简单地丢弃。解封装规则与 ECN 不兼容，因为外层 IP TOS/流量类别字段中的 ECN 位将丢失。

IPsec 隧道实现可以通过设置 net.inet.ipsec.ecn（或 net.inet6.ipsec6.ecn）为某个值来实现三种行为：

RFC2401：不考虑 ECN（sysctl 值为 -1）
禁止 ECN（sysctl 值为 0）
允许 ECN（sysctl 值为 1）

请注意，行为是按节点进行配置的，而不是按安全关联（SA）配置的（draft-ipsec-ecn-00 提出了按 SA 配置，但我认为这过于复杂）。

行为总结如下（更多细节请参阅源代码）：

封装                                解封装
                ---                             ---
RFC2401         将所有 TOS 位从内层复制到外层   丢弃外层的 TOS 位（按原样使用内层 TOS 位）

ECN forbidden   将除了 ECN 外的所有 TOS 位复制   丢弃外层的 TOS 位（按原样使用内层 TOS 位）
                （与 0xfc 相掩码）从内层复制到外层  将 ECN 位设置为 0。

ECN allowed     将除了 ECN 外的所有 TOS 位复制   使用内层 TOS 位，并做一些修改。如果外层 ECN CE 位
                （与 0xfe 相掩码）从内层复制到外层   为 1，则在内层启用 ECN CE 位
                将 ECN CE 位设置为 0。              。

配置的通用策略如下：

如果两个 IPsec 隧道端点都支持 ECN 友好的行为，最好将两端都配置为“允许 ECN”（sysctl 值为 1）。
如果另一端对 TOS 位要求非常严格，则使用“RFC2401”（sysctl 值为 -1）。
在其他情况下，使用“禁止 ECN”（sysctl 值为 0）。

默认行为是“禁止 ECN”（sysctl 值为 0）。

有关更多信息，请参阅：

8.1.4.6. 互操作性

以下是 KAME 代码过去在多个平台上测试 IPsec/IKE 互操作性的情况。请注意，双方可能已修改过其实现，因此请仅将以下列表作为参考。

Altiga、Ashley-laurent（vpcom.com）、Data Fellows（F-Secure）、Ericsson ACC、FreeS/WAN、HITACHI、IBM AIX®、IIJ、Intel、Microsoft® Windows NT®、NIST（Linux IPsec + plutoplus）、Netscreen、OpenBSD、RedCreek、Routerware、SSH、Secure Computing、Soliton、Toshiba、VPNet、Yamaha RT100i

开发者手册

developers-handbook

FreeBSD 开发者手册

商标

概述

第一部分 基础

第 1 章 简介

1.1. 在 FreeBSD 上进行开发

1.2. BSD 的愿景

1.3. 架构指导方针

1.4. /usr/src 的结构

第 2 章 编程工具

2.1. 概要

2.2. 引言

2.3. 编程简介

2.3.1. 解释器

2.3.2. FreeBSD 提供的解释器

2.3.3. 编译器

2.4. 使用 cc 编译

2.4.1. 常见的 cc 查询和问题

2.4.1.1. 我编译了一个名为 foobar.c 的文件，但找不到名为 foobar 的可执行文件。它去了哪里？

2.4.1.2. 好的，我有一个名为 foobar 的可执行文件，在运行 ls 时能看到它，但当我在命令行中输入 foobar 时，告诉我没有这样的文件。为什么它找不到？

2.4.2. 我叫我的可执行文件为 test，但运行时什么也没发生。怎么回事？

2.4.2.1. 我编译了程序，刚开始似乎运行得很好，然后出现了一个错误，说什么“core dumped”。那是什么意思？

2.4.2.2. 很有意思，但我现在该做什么？

2.4.2.3. 当我的程序发生 core dump 时，它提到一个“segmentation fault”。那是什么意思？

2.4.2.4. 有时当我得到一个 core dump 时，它说是 bus error。我在 UNIX® 书上看到说这意味着硬件问题，但电脑似乎还在工作。这是真的吗？

2.4.2.5. 这个 core dump 的过程看起来很有用，如果我能在需要时使其发生就好了。我可以这样做吗，还是只能等到出错？

2.5. Make

2.5.1. 什么是 make？

2.5.2. 使用 make 的示例

2.5.3. make 和包含文件

2.5.4. FreeBSD Makefile

2.5.5. make 的高级用法

2.6. 调试

2.6.1. 可用调试器简介

2.6.2. 使用 lldb

2.6.2.1. 启动 lldb

2.6.2.2. 使用 lldb 运行程序

2.6.2.3. 使用 lldb 检查核心文件

2.6.2.4. 使用 lldb 附加到正在运行的程序

2.6.3. 使用 LLDB 进行远程调试

2.6.4. 使用 gdb

2.6.4.1. 启动 gdb

2.6.4.2. 使用 gdb 运行程序

2.6.4.3. 使用 gdb 检查 Core 文件

2.6.4.4. 附加到正在运行的程序

2.7. 使用 Emacs 作为开发环境

2.7.1. Emacs

2.7.2. 配置 Emacs

2.7.3. 示例 .emacs

2.7.4. 扩展 Emacs 支持的语言范围

2.8. 进一步阅读

第 3 章 安全编程

3.1. 概要

3.2. 安全设计方法论

3.3. 缓冲区溢出

3.3.1. 缓冲区溢出示例

3.3.2. 避免缓冲区溢出

3.3.2.1. 基于编译器的运行时边界检查

3.3.2.2. 基于库的运行时边界检查

3.4. SetUID 问题

3.5. 限制程序运行环境

3.5.1. FreeBSD 的 jail 功能

3.5.2. POSIX®·1e 进程能力

3.6. 信任

3.7. 竞争条件

第 4 章 本地化和国际化——L10N 和 I18N

4.1. 编写符合 I18N 标准的程序

4.1.1. 统一 I18N 努力的呼声

4.1.2. Perl 与 Python

4.2. 使用 POSIX.1 本地语言支持（NLS）实现消息本地化

4.2.1. 将本地化消息组织成目录文件

4.2.2. 在源代码中使用目录文件

4.2.3. 一个实际示例

4.2.3.1. 减少需要本地化的字符串数量

4.2.4. 使用 bsd.nls.mk

第 5 章. 源代码树准则与规范

5.1. 编码风格指南

5.2. Makefile 中的 MAINTAINER

第一部分基础

第 1 章简介

第 2 章编程工具

2.4. 使用 `cc` 编译

2.4.1. 常见的 `cc` 查询和问题

2.4.1.2. 好的，我有一个名为 foobar 的可执行文件，在运行 `ls` 时能看到它，但当我在命令行中输入 foobar 时，告诉我没有这样的文件。为什么它找不到？

2.5.1. 什么是 `make`？

2.5.2. 使用 `make` 的示例

2.5.3. `make` 和包含文件

2.5.5. `make` 的高级用法

第 3 章安全编程

第 4 章本地化和国际化——L10N 和 I18N

5.2. Makefile 中的 `MAINTAINER`

第 6 章回归测试与性能测试

第 7 章套接字

7.6.1. `gethostbyname`

7.6.2. `getservbyname`

第三部分内核

第四部分架构

第五部分附录

第 2 章编程工具

2.4. 使用 `cc` 编译

2.4.1. 常见的 `cc` 查询和问题

2.4.1.2. 好的，我有一个名为 foobar 的可执行文件，在运行 `ls` 时能看到它，但当我在命令行中输入 foobar 时，告诉我没有这样的文件。为什么它找不到？

2.5.1. 什么是 `make`？

2.5.2. 使用 `make` 的示例

2.5.3. `make` 和包含文件

2.5.5. `make` 的高级用法