cost 74 ms
使用文件内的特定字符串命名 csplit 文件 - Naming csplit files with a specific string inside the file

所以,我有一个名为“test.log”的文件,其中包含多个条目,如下所示: 我想要的是创建 X 文件,每个文件必须包含一个 TestCase。 我使用以下命令将其存档: 现在,我使用此方法创建的文件称为xx5.log或xx0.log或类似的措辞。 我想要的是修改这个脚本,以便通过其相关的测试用例名称 ...

在 n 个非连续空行后拆分文件 - Split file after n number of non consecutivempty lines

我试图在 n 个空行之后拆分一个大文本文件。 文本文件只包含一个空行作为数据分隔符。 如下所示: 我曾尝试使用 csplit 我的期望是在 3 个空行之后(不是连续的,而是在光标处理 3 个空行之后)它拆分文件并继续这样做。 但它实际上在每个空行中拆分文件。 我预期的文件:xx00 ...

如何使用 csplit 根据每 X 个分隔符匹配来拆分文件 - How to use csplit to split a file based on every X amount of delimiter matches

我有一个 457 MB 的文件,并试图将其拆分为更小的文件。 这是目前的工作: 但是,这为我创建了大约 61.5k,因为我在这个 457MB 文件中有大量这些条目。 最终,我可能会按每 50 个条目而不是每个条目来分解它。 有没有办法修改它来实现这一点? 我在某种程度上尝试在 Ruby 中执行此操作 ...

解析一组值的第一个实例 - Parsing on the first instance of a set of values

我在 R 中有一个数据框,如下所示。 我希望将 FRUITSTRING 列拆分为两列,但根据名为 SPLIT_CHAR 的第二列的值逐行拆分。 是否有可能做到这一点? 注意字符串长度可以改变,分割字符的位置可以改变,这就是为什么我想调用一个特定的字符来进行分割。 我以前使用的函数是 cSpli ...

将大文件一分为二,同时保留 header - Splitting large file in two while keeping header

我有一个非常大的文本文件(约 1.8TB),需要在某个条目处拆分。 我知道这个条目在哪一行,但我也可以通过 grep 命令识别它。 从这个条目开始,我只关心文件的一部分。 我看到像 csplit 这样的某些 Unix 命令可以做到这一点。 但是,该文件还有一个重要的 header(30 行长),重 ...

如何根据 RegEx 模式将文件拆分为多个文件? - How do I split a file into multiple file based on a RegEx pattern?

我想根据特定的正则表达式模式将一个文件拆分为多个文件。 我在下面提供了一个可重现的示例。 如果有更简单的解决方案,我也欢迎! 我有一个包含以下文件的目录: page1.html page2.html page3.html 说我的 page1.html 看起来像这样: 我想将 page1.html ...

从一个文件中创建名称与模式匹配的多个文件 - Creating multiple files with names matching a pattern from one file

我有一个文本文件,例如: 我想用每个“--”之间的内容创建多个文本文件。 文本文件将以“>”开头的字符串命名。 最后我会有这些文本文件: 内容如下: Tolten.WP_096573835.1文本文件: Trivar.WP_011317016.1文本文件: uniSU2.WP_08543 ...

如何转换我的数据框以制作行列? - How to transform my data frame to make rows columns?

我有一个包含两列“类型”和“统计数据”的数据框。 我希望每种类型都有一行,所有统计数据都在单独的列中。 例如,我的数据框如下所示: 我希望它看起来像: 并非所有类型都具有相同数量的统计数据,某些类型缺少统计值,而其他类型则有额外的统计数据。 我尝试使用 t(),但遇到了问题。 然后我尝试将 ...

根据日期前缀拆分文件? - Split File based on date prefix?

我有这个文件.log 我想根据日期分区进行拆分,所以我得到了, Sep_16.log Sep_17.log 我在论坛中搜索,它应该使用csplit和正则表达式^.{6} ,但我得到的答案只是将正则表达式用作分隔符,这不是我想要的。 另外,我想为每个日期分区拆分 10k 行,因此文件名将类似于S ...

使用cSplit将字符串拆分为大写字母的多行 - Split string into multiple rows by capital letters with cSplit

我有调查数据。 一些问题允许多个答案。 在我的数据中,不同的答案用逗号分隔。 我想在数据框中为每个选项添加一个新行。 所以我有这样的事情: 如果逗号只是用于划分我使用的多个选项: 并获得所需的结果。 鉴于一些逗号是答案的一部分,我尝试使用逗号后跟大写字母作为分隔符: ...

如何分割标签? - How to csplit on tabs?

我有一个制表符分隔的文件,其中的数据块由空字段行分隔。 看起来像这样: 我正在尝试使用csplit将文件拆分为多个块。 当我的模式有23个匹配项时,它仅创建两个文件: 我正在使用CTRL-V进入选项卡,'\\ t'不适用于csplit或grep。 环境是Cygwin上的Ba ...

2019-02-28 22:19:07   1   16    regex / csplit  
使用csplit根据分隔符分割文本文件时遇到问题 - Trouble using csplit to split a text file based on delimiter

我有一个包含多个文本块的文本文件。 在每个块之间,我插入了字符串'######## START OF NEW ARTICLE ########'。 我正在尝试使用csplit在每个实例中拆分文件,以获取单独的文件,每个文件都包含唯一的文本块。 这是我通过终端运行的内容: 我收到 ...

cspilt后将管道输出到压缩的tar - Pipe output to zipped tar after cspilt

因此,我有以下情况: 产生大量(必须压缩)输出的代码,如下所示: 我生成此内容并将其压缩为: 我想做的是用伪代码: 理想情况下,未解压缩的文件永远不会进入硬盘驱动器。 总结:我的目标是将一组文件以压缩状态在硬盘驱动器上的分隔符上拆分,而无需中间的读写步骤。 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM