Linux文本处理命令

Sort命令

sort命令的功能是对档案中的各行进行排序。sort命令有许多非常实用的选项，这些选项最初是用来对资料库格式的档案内容进行各种排序操作的。实际上，sort命令可以被认为是一个非常强大的数据管理工具，用来管理内容类似资料库记录的档案。

Sort命令将逐行对档案中的内容进行排序，如果两行的首字元相同，该命令将继续比较这两行的下一字元，如果还相同，将继续进行比较。

语法：

sort [选项] 档案

说明：sort命令对指定档案中所有的行进行排序，并将结果显示在标準输出上。如不指定输入档案或使用“- ”，则表示排序内容来自标準输入。

sort排序是根据从输入行抽取的一个或多个关键字进行比较来完成的。排序关键字定义了用来排序的最小的字元序列。预设情况下以整行为关键字按ASCII字元顺序进行排序。

改变预设设定的选项主要有：

- m 若给定档案已排好序，合併档案。

- c 检查给定档案是否已排好序，如果它们没有都排好序，则列印一个出错信息，并以状态值1退出。

- u 对排序后认为相同的行只留其中一行。

- o 输出档案将排序输出写到输出档案中而不是标準输出，如果输出档案是输入档案之一，sort先将该档案的内容写入一个临时档案，然后再排序和写输出结果。

改变预设排序规则的选项主要有：

- d 按字典顺序排序，比较时仅字母、数字、空格和制表符有意义。

- f 将小写字母与大写字母同等对待。

- I 忽略非列印字元。

- M 作为月份比较：“JAN”<“FEB” p>

- r 按逆序输出排序结果。

+posl - pos2 指定一个或几个栏位作为排序关键字，栏位位置从posl开始，到pos2为止（包括posl，不包括pos2）。如不指定pos2，则关键字为从posl到行尾。栏位和字元的位置从0开始。

- b 在每行中寻找排序关键字时忽略前导的空白（空格和制表符）。

- t separator 指定字元separator作为栏位分隔设定。

下面通过几个例子来讲述sort的使用。

用sort命令对text档案中各行排序后输出其结果。请注意，在原档案的第二、三行上的第一个单词完全相同，该命令将从它们的第二个单词vegetables与fruit的首字元处继续进行比较。

$ cat text

vegetable soup

fresh vegetables

fresh fruit

lowfat milk

$ sort text

fresh fruit

fresh vegetables

lowfat milk

vegetable soup

用户可以保存排序后的档案内容，或把排序后的档案内容输出至印表机。下例中用户把排序后的档案内容保存到名为result的档案中。