运用sed命令高效地删除文件的特定行

运用 sed 命令高效地删除文件的特定行

正常来讲,咱们想要删除文件中的某些行内容,通常都是先打开这个文件,而后找到要删除的内容,再而后选中这些行并按删除键进行删除,这在数据量不多时是没有问题的。可是,一旦文件中的行数据很是多,并且数据冗杂的状况下,你还要用上面的方法去作的话就很恐怖了。为此,今天这篇文章将带你们一块儿学习运用 sed 命令行工具,即便在数据多而杂的状况下也能高效而优雅地删除文件中的特定行内容。linux

sedStream Editor 的简写,它用于在 Linux 中进行基本的文本转换,是文件操做的一个重要命令,因此,咱们也能够用它来实现文本的删除操做。正则表达式

下面是一些 sed 命令的使用示例,覆盖了大多数的使用场景,由浅入深地帮助你学习 sed 命令,让你轻松地实现高效删除文件的特定行内容。ubuntu

首先咱们准备一个演示文件 sed-demo.txt工具

# cat sed-demo.txt

1 Linux Operating System
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

而后咱们就能够运用 sed 命令进行实验了。学习

注意:-i 表示直接进行文件操做,而不在终端上显示结果。由于是演示因此这里不带 -i 选项,咱们在实际中请带上 -i 选项命令行

1. 删除某一行

首先,咱们先从删除某一行开始,好比删除第一行、最后一行,实际也就是第 N 行嘛。code

删除第 N 行的命令格式:字符串

sed 'Nd' file

咱们来删除第一行试试:it

# sed '1d' sed-demo.txt

After deletion:
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

很简单是吧?这里就很少做解释了,你想要删除第几行的内容只须要把命令中的 1 替换一下就 ok 了。io

那问题来了,最后一行用什么数字表示呢?这里给你们一个小提示,能够用美圆符号 $ 表示最后,因此删除最后一行的命令能够这么写:

# sed '$d' sed-demo.txt

After deletion:
1 Linux Operating System
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
2. 删除某些行

sed 命令能够删除连续又或者不连续的行内容。

删除连续的行,例如删除从 5 到 7 行 的内容:

# sed '5,7d' sed-demo.txt

After deletion:
1 Linux Operating System
2 Unix Operating System
3 RHEL
4 Red Hat
8 Debian
9 Ubuntu
10 openSUSE

删除不连续的行,例如删除第 1 、第 5 、第 9 和最后一行

# sed '1d;5d;9d;$d' sed-demo.txt

After deletion:

2 Unix Operating System
3 RHEL
4 Red Hat
6 Arch Linux
7 CentOS
8 Debian

另外,它还能够配合逻辑非 ! 使用,好比删除第 3到 6 行之外的其余行:

# sed '3,6!d' sed-demo.txt

After deletion:

3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
3. 删除空白行

sed 还支持删除文件的空白行,命令以下:

# sed '/^$/d' sed-demo.txt

After deletion:

1 Linux Operating System
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

提示:这里两个斜杠 / / 内的表达式起到了文本匹配的做用,你们能够参考正则表达式的使用方法。下面将列举一些经常使用的方法来加深你们的学习。

4. 删除包含特定字符的行

假设咱们想要删除示例文件中的包含 System 这个单词的行内容,咱们能够用 /System/,它表示有出现 System 这个字符串就进行匹配,具体的命令以下:

# sed '/System/d' sed-demo.txt

After deletion:

3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

不只如此,咱们还能够加上一下逻辑条件,比方说下面的命令:

# sed '/System\|Linux/d' sed-demo.txt

After deletion:

3 RHEL
4 Red Hat
5 Fedora
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

反斜杠 \ 表明逻辑或,上述命令的意思是文本中有 SystemLinux 的行都要进行删除。

5. 删除特定字符开头的行

首先,咱们建立另外一个示例文件 sed-demo-1.txt 进行更好地演示,其内容以下:

# cat sed-demo-1.txt

After deletion:
Linux Operating System
Unix Operating System
RHEL
Red Hat
Fedora
debian
ubuntu
Arch Linux - 1
2 - Manjaro
3 4 5 6

上面也已经提到过,$ 号能够理解为结尾,那么有没有字符能够表明开头呢?答案是有的,这里咱们能够用 ^ 号表明开头。

那么,咱们想要删除以某一个字符开头的行时,好比说删除以 R 开头的行,可使用以下命令:

# sed '/^R/d' sed-demo-1.txt
 
After deletion:
Linux Operating System
Unix Operating System
Fedora
debian
ubuntu
Arch Linux - 1
2 - Manjaro
3 4 5 6

那么问题来了,好比我想删除以 R 或者 F 开头的行,那我是否是要执行两次命令呢?若是是有更多岂不是要执行屡次命令?这里它有一个简单的写法,你只要把这些字符写在一对中括号 [] 里就能够了:

# sed '/^[RF]/d' sed-demo-1.txt

After deletion:
Linux Operating System
Unix Operating System
debian
ubuntu
Arch Linux - 1
2 - Manjaro
3 4 5 6

上面命令的做用是 删除以 R 或者 F 开头的行

6. 删除特定字符结尾的行

同上面一个道理,删除以某一个字符结尾的行,比方说删除以 m 结尾的行,咱们能够这样作:

# sed '/m$/d' sed-demo.txt

After deletion:
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

删除以 x 或 m 结尾的行能够这样写:

# sed '/[xm]$/d' sed-demo.txt

After deletion:

3 RHEL
4 Red Hat
5 Fedora
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE
7. 删除以大写字母开头的行

这里问题又来了,我想要删除全部以大写字母开头的行呢?按照上面的作法是否是要将 A 到 Z 这 26 个字母都写进 [ ] 里呢? 其实咱们大可没必要这样作,在 A 和 Z 中间加个 - 就能够了:

# sed '/^[A-Z]/d' sed-demo-1.txt

After deletion:
debian
ubuntu
2 - Manjaro
3 4 5 6

机智的你看到这里确定会想到其余相似的用法的了,不妨看看下面是否有你想到的命令吧。

8. 删除包含字母字符的行
# sed '/[A-Za-z]/d' sed-demo-1.txt

After deletion:
3 4 5 6
9. 删除包含数字的行
# sed '/[0-9]/d' sed-demo-1.txt

After deletion:

Linux Operating System
Unix Operating System
RHEL
Red Hat
Fedora
debian
ubuntu

另外,经过这个例子,咱们能够加上 ^$ 更好地看到他们三个之间的区别:

# sed '/^[0-9]/d' sed-demo-1.txt

After deletion:

Linux Operating System
Unix Operating System
RHEL
Red Hat
Fedora
debian
ubuntu
Arch Linux - 1
# sed '/[0-9]$/d' sed-demo-1.txt

After deletion:

Linux Operating System
Unix Operating System
RHEL
Red Hat
Fedora
debian
ubuntu
2 - Manjaro
10. 其余更多

实际上,咱们要删除的文件内容是更为具体的,简单的条件是知足不了咱们的需求的,因此,sed 也支持更复杂的条件组合。比方说我要指定删除在 1 到 6 行内有 Linux 这个词的内容,那么:

# sed '1,6{/Linux/d;}' sed-demo.txt

After deletion:
2 Unix Operating System
3 RHEL
4 Red Hat
5 Fedora
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

删除包含 System 以及其下一行的内容

# sed '/System/{N;d;}' sed-demo.txt

After deletion:
3 RHEL
4 Red Hat
5 Fedora
6 Arch Linux
7 CentOS
8 Debian
9 Ubuntu
10 openSUSE

公众号:良许Linux

有收获?但愿老铁们来个三连击,给更多的人看到这篇文章