cost 106 ms
解析CSV大文件,bash中有异常字符、空格、括号、不规则回车

[英]Parsing a large CSV file with unusual characters, spacing, brackets, and irregular returns in bash

我有一个非常大的 (1.5 GB) 格式错误的 CSV 文件,我需要读入 R,虽然文件本身是 CSV,但由于行返回位置不当,分隔符在一定数量的行后中断。 我附上了一个简化的示例,但它的截断视觉表示如下所示: CSV 中的新行和所有作为/n 的行。 为了解决将其全部加载到 memory 并尝试在其他 ...

从 fasta 文件打印序列

[英]Printing a sequence from a fasta file

我经常需要在 fasta 文件中找到一个特定的序列并打印出来。 对于那些不知道的人,fasta 是生物序列(DNA、蛋白质等)的文本文件格式。 这很简单,您有一行序列名称前面有一个“>”,然后是下一个“>”之前的所有行都是序列本身。 例如: 我目前获得所需序列的方法是将 grep 与 - ...

用 grep 捕获整个 function

[英]Catch an entire function with grep

想要用另一个替换文件中的 function。 我有这个: 文件 1.cpp: 和 File2.cpp: 我尝试编写脚本,但我的 grep 没有提供结果: ...

2023-01-24 10:27:19   3   102    bash / unix / grep  
是否可以使用“for loop grep”命令?

[英]Is it possible to work with 'for loop grep' commands?

我每年目录中都有很多文件在每个文件中都有像这样的又长又大的句子 for exmaple 项目清单home/2001/2001ab.txt home/2002/2002ab.txt home/2003/2003ab.txt 在主目录中,我得到了home/reference.txt (word 文件列 ...

如何删除除属于多个组的行以外的所有行

[英]How to delete all rows except those belonging to more than one group

假设我有一个数据集“df”如下如何删除除属于组“b”和“d”(或属于两个或三个组的任意组合的行)之外的所有行? 如果我只能保留一组,我知道该怎么做,但不知道如何保留多个。 例如,使用 grep function 我可以df <- df[grep("b", df$group),] 但同样,如何 ...

如何抓取过滤结果的数量

[英]How to grab filter the numbers of results

这个问题是从 Stack Overflow 迁移过来的,因为它可以在 Super User 上回答。 昨天迁移。 我使用grep -E '^[ 0-9]{6}$'在文件中获取 5 位数字(数字或空格)的字符串它返回:71 051 17 293 017299 862610 但是是否可以只提取第一次 ...

2023-01-28 12:49:21   1   10    grep  
用不同的颜色给 output 上色

[英]Colorize output with different color

我需要使用 ANSI 颜色为 output 上色,例如蓝色,然后我们抓取一个文件。 但是如果我们在文件中出现 grep 字错误,这个字必须是红色的我尝试使用 grep --colour=always 但它在单词匹配后将颜色重置为默认值例如我的控制台现在是蓝色文本,但如果我使用 安慰我需要控制台回到蓝 ...

什么正则表达式字符串可以区分包含“PE null null L”和“PE null null d”的文件

[英]What regex strings can distinguish files containing "PE null null L" from "PE null null d"

我需要一种快速简便的方法来了解给定目录中有多少 dll 是 32 位的,有多少是 64 位的。 当我想到一个更简单的解决方案时,我正准备编写一个 PowerShell 脚本。 我在下面展示了我的想法可以工作,但我需要一点正则表达式帮助才能使其正常工作。 已经证明可以在记事本中打开 dll 文件,只需 ...

grep- 提取存在于一个文档中但不存在于其他文档中的文本

[英]grep- Extract text present in one document but absent in other

我想做一些现在不存在的分析。 我有三个不同的蛋白质文件,我想识别/提取存在于一个文件中而其他文件中不存在的蛋白质(它们以简单的文本形式存在,反之亦然)。 我假设我可以使用“grep”命令来完成,但我不确定具体细节。 非常感谢您的帮助。 谢谢! ...

2023-01-30 05:47:23   1   22    linux / grep  
查找在访问日志中发出超过 10 个请求的用户代理和 IP

[英]Finding User Agents and IPs which make more than 10 req/s in access logs

我想找到每秒发出超过 10 个服务器请求的 IP 个地址和用户代理。 请帮帮我。 我怎样才能做到这一点? 也许用 awk、grep? 这是我的访问日志中的典型行: 为了查找有关 UA 的信息,我正在运行这个:(给我每个独特 UA 的点击量) 我可以做些什么来使这些命令仅向我显示每秒超过 10 个请 ...

我在 regex101.com 中为 email 地址尝试了这个但是当我在 R 和 grep 中应用它时它不起作用

[英]I tried this in regex101.com for email addresses but when i apply it in R with grep it does not work

我试图在 regex101.com 中编写代码来识别任何类型的 email 地址。 一般的email地址格式是这样的: rohan.singh@example.com rakesh@example.com hamed.jelveh@example.dd.rr 这个命令在www.regex101.co ...

Bash - 将某些服务的端口号读入数组

[英]Bash - Read portnumbers of certain service(s) into array

我正在使用 grep 搜索端口号(在 bash 脚本中) portstr 现在看起来像这样 现在我想提取冒号 (:) 和后面的空格之间的数字,得到这样的结果端口数组[0]=>22 端口阵列[1]=>22 谢谢你我试过这个 从这里。 但没有任何结果。 ...

使用 grep 查找所有电子邮件

[英]Using grep to find all emails

如何正确构造“grep”linux 程序的正则表达式,以找到所有 email,例如 /etc 目录? 目前,我的脚本如下: 它工作正常 - 看到一些电子邮件,但是当我修改它时,在“@”符号之前和之后捕获一个或多个字符...... ..它完全停止工作此外,它不会捕获格式为“Name.LastName ...

2010-05-24 16:24:01   9   47207    linux / grep  
具有多个捕获组的 pcregrep

[英]pcregrep with multiple capturing groups

pcregrep 中的 -oX 选项有问题。 指定多个具有不同编号的此类选项仅输出最后指定的捕获组。 数据: docker ps | awk '{print $1}' | tail -n +2 | xargs docker inspect 输出: 理念docker ps | awk '{prin ...

如何抓取过滤结果的数量

[英]How to grab filter the numbers of results

我使用grep -E '^[ 0-9]{6}$'在文件中获取 5 位数字(数字或空格)的字符串它返回:71 051 17 293 017299 862610 但是是否可以只提取第一次出现的 2 次? 如果可能的话,在这个例子“71051-17293”中是这样的吗? ...

2023-01-28 12:49:21   1   22    grep  
Mac OS X 和 BSD 上的“git grep”和单词边界

[英]'git grep' and word boundaries on Mac OS X and BSD

我在我的 linux 开发服务器上定期运行git grep "\<blah\>" ,但我刚刚发现我无法在 Mac (Mac OS X 10.6.8) 上使用\<和\> (无法使用 =它没有找到任何东西)。 Mac 中的正则表达式语法是否不同? 我尝试使用git grep - ...

grep “Sound On” && echo “do something” 命令没有给我结果

[英]grep "Sound On" && echo "do something" command does not give me result

我试着看看广播电台是否在广播静音。 由于这个测试目的,我从 grep 中删除了--quiet并将Sound Off反转为Sound On ,这样我可以得到响应do something 。 Grep 现在总能找到字符串Sound On将其着色为红色。 但是我没有得到 echo 命令的响应。 如果我使 ...

2023-01-27 20:52:41   1   31    bash / grep  
在文本文件行中搜索一个值并显示一定数量的结果

[英]search lines of text file for a value and show results over a certain number

我有一个这种格式的文本文件: 地址、姓名、姓名 2、计数、垃圾我想搜索(在 Linux 上使用正则表达式或 grep)“计数”超过一定数量的行。 这可能吗? 如果没有,我想我必须将数据加载到 mysql 中,这样我才能运行查询。 谢谢! ...

打印命令上方的最后一行,仅当该行以“#”开头并且前面没有空格或制表符时

[英]Print the last line above the command, only if the line starts with "#" and there is no space or tab before it

我想打印命令上方的最后一行,只有当该行以“#”开头并且它前面没有空格或制表符时,即使命令和以“#”开头的行之间有一个空行. 例子: 预计 output: 我要求 ChatGPT 解决这个问题,但是如果 #line 和命令之间有一个空行,下面的命令就不起作用: ...

仅在特定行中获取文本后的前 2 个数字以进行乘法

[英]get the first 2 numbers after text in only specific lines for multiplication

我有一个文件,我在其中获取数据并将其精简,以便我只拥有我需要的东西。 但是,我有一些带有数字的行,我可能需要抓取这些数字并将其放入另一个文件中,这样我就可以将它们相乘或就地相乘,并将 output 乘以 a.csv。 它也可能有助于放入适当的列。 这是一个线条示例,我将在 42000 行给予或接受上 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM