[英]Manipulating strings in bash
我有一个文件,其中包含经过搜索后得到的google页面。 我用了
w3m -no-cookie $search > google
制作页面
之后,我需要获取该页面中包含的所有站点,因此基本上所有以“ www”开头并以“ /”结尾的字符串
我试过了 :
grep -Fw "www" google | awk -F "/" '{ print $1";" }'
但它为我提供了www之前在线上的所有内容
我该如何删除?
我应该使用sed吗?
谢谢!
假设所有站点都以www
开头有点奇怪,但是这里是:
您的问题是grep将返回整行。 使用-o
只会返回匹配的部分:
grep -wo "www.*" google | awk -F "/" '{ print $1";" }'
或者简单地:
grep -wo "www[^/]*" google
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.