csplit

csplit

将一个大文件分割成小的碎片文件

补充说明

csplit命令 用于将一个大文件分割成小的碎片,并且将分割后的每个碎片保存成一个文件。碎片文件的命名类似“xx00”,“xx01”。csplit命令是split的一个变体,split只能够根据文件大小或行数来分割,但csplit能够根据文件本身特点来分割文件。

语法

csplit(选项)(参数)

选项

-b<输出格式>或--suffix-format=<输出格式>:预设的输出格式其文件名称为xx00,xx01等,用户可以通过改变<输出格式>来改变输出的文件名;
-f<输出字首字符串>或--prefix=<输出字首字符串>:预设的输出字首字符串其文件名为xx00,xx01等,如果制定输出字首字符串为“hello”,则输出的文件名称会变成hello00,hello、01......
-k或--keep-files:保留文件,就算发生错误或中断执行,与不能删除已经输出保存的文件;
-n<输出文件名位数>或--digits=<输出文件名位数>:预设的输出文件名位数其文件名称为xx00,xx01......如果用户指定输出文件名位数为“3”,则输出的文件名称会变成xx000,xx001等;
-q或-s或--quiet或——silent:不显示指令执行过程;
-z或--elide-empty-files:删除长度为0 Byte文件。

参数

  • 文件:指定要分割的原文件;
  • 模式:指定要分割文件时的匹配模式。

实例

示例测试文件 server.log

cat server.log
SERVER-1
[con] 10.10.10.1 suc
[con] 10.10.10.2 fai
[dis] 10.10.10.3 pen
[con] 10.10.10.4 suc
SERVER-2
[con] 10.10.10.5 suc
[con] 10.10.10.6 fai
[dis] 10.10.10.7 pen
[con] 10.10.10.8 suc
SERVER-3
[con] 10.10.10.9 suc
[con] 10.10.10.10 fai
[dis] 10.10.10.11 pen
[con] 10.10.10.12 suc

需要将server.log分割成server1.log、server2.log、server3.log,这些文件的内容分别取自原文件中不同的SERVER部分:

[root@localhost split]# csplit server.log /SERVER/ -n2 -s {*} -f server -b "%02d.log"; rm server00.log
[root@localhost split]# ls
server01.log  server02.log  server03.log  server.log

命令详细说明:

/[正则表达式]/   #匹配文本样式,比如/SERVER/,从第一行到包含SERVER的匹配行。
{*}     #表示根据匹配重复执行分割,直到文件尾停止,使用{整数}的形式指定分割执行的次数。
-s      #静默模式,不打印其他信息。
-n      #指定分割后的文件名后缀的数字个数。比如01、02、03等。
-f      #指定分割后的文件名前缀。
-b      #指定后缀格式。比如%02d.log,类似于C语言中的printf参数格式。
rm server00.log    #是删除第一个文件,因为分割后的的第一个文件没有内容,匹配的单词就位于文件的第一行中。

若文章对你有帮助,可以点赞或打赏支持我们。发布者:Aurora,转载请注明出处:http://61.174.243.28:13541/AY-knowledg-hub/csplit/

(0)
AuroraAurora站点维系者
上一篇 2023年 12月 7日 下午7:06
下一篇 2023年 12月 7日 下午7:07

相关推荐

  • Helm | Helm 仓库列表

    文章目录helm repo list可选项从父命令继承的命令请参阅 helm repo list 列举chart仓库 可选项 -h, –help help for list -o…

    入门教程 2023年 12月 14日
  • wget

    文章目录wget补充说明语法选项参数实例 wget Linux系统下载文件工具 补充说明 wget命令 用来从指定的URL下载文件。wget非常稳定,它在带宽很窄的情况下和不稳定网…

    入门教程 2023年 12月 27日
  • kexec

    文章目录kexec补充说明语法选项 kexec 从当前正在运行的内核引导到一个新内核 补充说明 kexec命令 是Linux内核的一个补丁,让您可以从当前正在运行的内核直接引导到一…

    入门教程 2023年 12月 19日
  • rcconf

    文章目录rcconf补充说明语法选项 rcconf Debian Linux下的运行等级服务配置工具 补充说明 rcconf命令 是Debian Linux下的运行等级服务配置工具…

    入门教程 2024年 3月 1日
  • dd

    文章目录dd补充说明语法选项实例 dd 复制文件并对原文件的内容进行转换和格式化处理 补充说明 dd命令 用于复制文件并对原文件的内容进行转换和格式化处理。dd命令功能很强大的,对…

    入门教程 2023年 12月 7日
  • Java 简介

    Java 是由 Sun Microsystems 公司于 1995 年 5 月推出的 Java 面向对象程序设计语言和 Java 平台的总称。由 James Gosling和同事们…

    入门教程 2023年 3月 4日
  • basename

    文章目录basename补充说明语法选项参数实例 basename 打印目录或者文件的基本名称 补充说明 basename命令 用于打印目录或者文件的基本名称。basename和d…

    入门教程 2023年 12月 6日
  • ftpcount

    ftpcount 显示目前已FTP登入的用户人数 补充说明 显示目前已ftp登入的用户人数。执行这项指令可得知目前用FTP登入系统的人数以及FTP登入人数的上限。 语法: ftpc…

    入门教程 2023年 12月 14日
  • HTML 表格

    表格由 <table> 标签来定义。每个表格均有若干行(由 <tr> 标签定义),每行被分割为若干单元格(由 <td> 标签定义)。字母 td …

    2023年 4月 13日
  • Helm | Helm 仓库

    文章目录helm repo简介可选项从父命令继承的命令请参阅 helm repo 添加、列出、删除、更新和索引chart仓库 简介 该命令由于chart仓库交互的多条子命令组成 可…

    入门教程 2023年 12月 14日
Translate »