Linux中的sed命令

Question

如何从文件中提取URL？ 我的文件名为URL_name.txt此文件内部有很多url。 看起来像这样：

<pre>
<pre><div></pre><something>something here<href="http://www.google.com/">something here</font>
<font><href="http://www.stackoverflow.com/">something</td>

..
..
..
</pre>

这是我的想法，我想删除URL之前的所有内容，然后删除URL之后的所有内容。 我如何使用sed命令处理它？ 输出应为

http://www.google.com/

http://www.stackoverflow.com/

Answer 1

使用tr和grep ：

tr '"' '\n' < URL_name.txt | grep http

Answer 2

可以使用Java。 您也可以尝试以下命令：

egrep -ie "<*HREF=(.*?)>" index.html | cut -d "\\"" -f 2 | grep ://
egrep -ie "<*HREF=(.*?)>" index.html | awk -F\\" '{print $2}' | grep ://

Answer 3

您可以使用grep ：

grep -o 'http://[^"]*' yourfile

Linux中的sed命令

问题描述

3 个解决方案

解决方案1
2 2016-01-20 08:23:21

解决方案2
0 2016-01-20 08:18:18

解决方案3
0 已采纳 2016-01-20 08:30:04

Linux中的sed命令

问题描述

3 个解决方案

解决方案1 2 2016-01-20 08:23:21

解决方案2 0 2016-01-20 08:18:18

解决方案3 0 已采纳 2016-01-20 08:30:04

解决方案1
2 2016-01-20 08:23:21

解决方案2
0 2016-01-20 08:18:18

解决方案3
0 已采纳 2016-01-20 08:30:04