我有以下数据集。 我试图弄清楚如何通过“未命名9”删除“未命名5”列。 我已经尝试了以下代码,但它无法正常工作。 数据(名为mapping_table): 码: 错误: 有更简单的方法吗? 我觉得我应该能够放弃像mapping_table.drop([mapp ...
提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供 中文繁体 英文版本 中英对照 版本,有任何建议请联系yoyou2525@163.com。
我有一个这样的文件(由 \t 分隔):
gene1 previous name1
gene2 previous name2
gene3 previous name3
gene4 previous name4
我想删除第一列中包含gene2和gene4的列。 我知道我可以使用sed或awk和但实际上我的文件有数千行,我想删除数百列(我有一个变量,其中包含我想要搜索的模式)。 我怎样才能做到这一点而不必手动编写所有模式?
模式变量:
gene2
gene4
预期 output:
gene1 previous name1
gene3 previous name3
我只想 grep 第一列,因为单词gene2 (或*gene4)可能在第三列。
使用grep
:
cat > in_file <<EOF
gene1 previous name1
gene2 previous name2
gene3 previous name3
gene4 previous name4
EOF
cat > pat_file <<EOF
gene2
gene4
EOF
grep -v -f pat_file in_file
Output:
gene1 previous name1
gene3 previous name3
在这里, grep
使用以下选项:
-v
:打印不匹配的行。
-f file
: 从file获取模式,每行一个。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.