linux sort命令详解

sort命令在Linux和Unix系统中用于按特定顺序排列文件内容。使用“sort”命令可以在文件中对行、字母和数字进行排序。Sort命令有许多有用的选项,可以反转顺序、对文件进行数字排序、按列编号对表进行排序、检查文件是否已排序以及删除重复项。在本教程中,我们将通过一些实际示例学习Linux中的sort命令。

Sort命令及其语法

下一行显示排序命令语法:

sort [options] [files]

默认情况下,它接受STDIN的输入,但当文件名作为参数提供时,它可以对文件进行排序,还可以进行数字排序。

可以通过在终端中键入Sort来调用Sort命令。然后,它将提示输入标准输入。输入STDIN后,输入ctrl+d标记输入结束。

以下输出显示按字母顺序重新排列来自STDIN的输入数据。

$ sort
cappa
beta
delta
theta
alpha

alpha
beta
cappa
delta
theta

对文件排序

默认情况下,sort将所有字符视为字符串。数字字符也被视为字符。

首先,我们创建一个包含要排序的数字数据的文件。以下命令创建一个包含数字数据的文件“numeric.txt”:

$ cat > numeric.txt
01
10
25
83
502
111

现在,让我们对文件’numeric.txt’进行如下排序:

$ sort numeric.txt
01
10
111
25
502
83

上面显示的输出不是我们通常期望的。当然,111大于25,502也大于83。但是如果你仔细看,这些数字是按字典顺序排列的。

例如,对于111和25,比较第一个字符,1在2之前。因此,111置于25之前。

现在让我们检查一下,当内容是字母或单词时,它是如何排序的。以下文件“wordlist.txt”包含以大写和小写开头的单词,并显示排序列表:

$ sort wordlist.txt
Aeroplane
ant
apple
bark
born
Box
Cat
tom

排序选项

Sort命令提供了很好的选项来排序文件内容。


sort -n: 对文件进行数字排序
sort -u: 抑制重复先前键的行
sort -k: 按列号对表进行排序
sort -t SEP: 使用提供的分隔符来标识字段
sort -M: 根据指定的日历月进行排序
sort -b: 忽略行开头的空格
sort -r: 按相反顺序排序
sort -o: 输出到新文件

### 对文件进行数字排序(-n选项)

如果我们想对文件中的内容进行数字排序,可以使用-n选项。

在以下示例中,“numeric.txt”文件包含数字,数据按数字顺序排序:

    $ sort -n numeric.txt
    01
    10
    25
    83
    111
    502

要反转文件中的数字,请使用-nr选项的组合。

例如:

    $ sort -nr numeric.txt
    502
    111
    83
    25
    10
    01

### 排序并删除重复行(-u选项)

要对文件中的重复行进行排序和删除,请使用-u选项。第一个命令将使用cat命令列出文件duplicate.txt的内容,第二个命令将使用-u选项删除重复行。

例子:

    $ cat duplicate.txt
    hello
    linux
    lInux
    Linux
    raghu
    world
    zzz
    zzz

“duplicate.txt”文件中删除了可以看到重复行的示例输出:

    $ sort -u duplicate.txt
    hello
    linux
    lInux
    Linux
    raghu
    world
    zzz

### 排序并忽略大小写(-f选项)

与许多其他Linux和Unix工具一样,sort命令默认情况下区分大小写。但是如果我们需要忽略大小写,我们可以使用-f或--ignore-case选项。

例如,在“duplicate.txt”中,在不同的情况下有三个单词“linux”的实例。默认情况下,它们都使用-u选项打印。这意味着它们对于sort命令不是唯一的。

但如果我们使用-f选项,它将被忽略,如下所示:

    $ sort -f -u duplicate.txt
    hello
    linux
    raghu
    world
    zzz

### 按列排序(-k选项)

sort命令可以使用-k选项使用列号对任何表进行排序。例如,使用“-k3”对表中的第三列进行排序。

让我们考虑一下,在“人口.txt”文件中有一个目录如下:

    $ cat population.txt
    Kids 500 India
    Youth 400 England
    Senior 600 USA
    Junior 9000 Australia
    Pensioners 650 China

在下面的示例中,我们使用population.txt文件中的第2列对表进行排序:

    $ sort -k2 population.txt
    Youth 400 England
    Kids 500 India
    Senior 600 USA
    Pensioners 650 China
    Junior 9000 Australia

### 对多列进行排序

在某些情况下,可能需要使用多列对表进行排序。让我们以一个包含多列数据的文件为例。

文件“columns.txt”后面包含多个列,如下所示:

    cat columns.txt
    version1.2    10  25
    version1.2    30  50
    version1.1    10  30
    version1.1    40  50
    version1.2    40  50
    version1.1    10  20
    version1.1    5   8

现在检查命令以按数字顺序对列1、2和3进行排序。

    $ sort -k1,1 -k2,2n -k3,3n columns.txt
    version1.1    5   8
    version1.1    10  20
    version1.1    10  30
    version1.1    40  50
    version1.2    10  25
    version1.2    30  50
    version1.2    40  50

### 按列字段分隔符排序(分隔符-t选项)

默认情况下,列的分隔符是空格或制表符。但我们可以在排序中使用-t或--field分隔符选项来使用自定义分隔符。

让我们举一个例子,使用冒号(:)作为分隔符,并使用“/etc/passwd”文件进行排序。

如果要根据UID对/etc/passwd文件进行排序,请使用以下命令:

    $ sort -n -t ':' -k3 /etc/passwd
    root:x:0:0:root:/root:/bin/bash
    bin:x:1:1:bin:/bin:/sbin/nologin
    daemon:x:2:2:daemon:/sbin:/sbin/nologin
    adm:x:3:4:adm:/var/adm:/sbin/nologin
    lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
    sync:x:5:0:sync:/sbin:/bin/sync
    shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
    halt:x:7:0:halt:/sbin:/sbin/halt
    mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
    news:x:9:13:news:/etc/news:
    uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
    operator:x:11:0:operator:/root:/sbin/nologin
    games:x:12:100:games:/usr/games:/sbin/nologin
    <---output truncated--->

### 按月排序(-M选项)

使用-M选项可以按月排序。如果文件包含月份,请按月份对命令顺序进行排序。

例如,“months.txt”文件包含月份名称列表。

    $ cat months.txt
    sep
    august
    july
    dec
    feb
    may
    jan

现在我们将使用-M选项按月对“months.txt”文件进行排序。

    $ sort -M months.txt
    jan
    feb
    may
    july
    august
    sep
    dec

### 对人类可读的数字进行排序(-h选项)

排序可以使用-h或--human numeric Sort选项对人类可读的数字进行排序,如2K、5G、3M。

例如,下面的文件列出了人类可读的数字

    $ cat human_numeric.txt
    4G
    2K
    3M
    1G
    34K
    52M
    200M

下面的命令使用-h选项来比较和排序人类可读的数字。

    $ sort -h human_numeric.txt
    2K
    34K
    3M
    52M
    200M
    1G
    4G

### 检查排序输入(-c选项)

sort命令可以检查输入是否已排序,或者是否未使用-c选项。如果未排序,则返回第一个未排序的行。

    $ sort -c /etc/passwd
    sort: /etc/passwd:2: disorder: daemon:x:1:1:daemon:/usr/sbin:/bin/sh

排序后的输入不打印任何内容:

    $ sort /etc/passwd | sort -c
    $ echo $?
    0

使用其他命令排序
--------

排序是一种文本处理工具,因此可以通过管道从另一个命令输入一些内容来使用它。

在以下命令中,我们使用tail命令输出作为排序的输入:

    $ tail /etc/passwd | sort
    altair:x:1001:1001:Altair Ibn La Ahad,,,,:/home/altair:/bin/bash
    bind:x:120:132::/var/cache/bind:/bin/false
    dnsmasq:x:121:65534:dnsmasq,,,:/var/lib/misc:/bin/false
    mysql:x:115:129:MySQL Server,,,:/nonexistent:/bin/false
    postfix:x:105:126::/var/spool/postfix:/bin/false
    raghu:x:1000:1000:raghu,,,:/home/raghu:/bin/bash
    smmsp:x:119:131:Mail Submission Program,,,:/var/lib/sendmail:/bin/false
    smmta:x:118:130:Mail Transfer Agent,,,:/var/lib/sendmail:/bin/false
    sshd:x:117:65534::/var/run/sshd:/usr/sbin/nologin
    statd:x:116:65534::/var/lib/nfs:/bin/false

可以使用-r选项反转排序。

让我们以另一个示例为例,使用以下命令以人类可读的格式按大小对du命令输出进行排序:

    $ du -h | sort -h

在本教程中,我们将学习Linux排序及其排序文件内容的选项。我希望你喜欢阅读,如果你发现任何其他例子,请在下面发表评论。
linux truncate命令详解
Linux Date命令详解
标签:

发表我的评论

电子邮件地址不会被公开。 必填项已用*标注

0 + 69 =

ajax-loader