簡體   English   中英

Linux中的sed命令

[英]Sed command in linux

如何從文件中提取URL? 我的文件名為URL_name.txt此文件內部有很多url。 看起來像這樣:

<pre>
<pre><div></pre><something>something here<href="http://www.google.com/">something here</font>
<font><href="http://www.stackoverflow.com/">something</td>

..
..
..
</pre>

這是我的想法,我想刪除URL之前的所有內容,然后刪除URL之后的所有內容。 我如何使用sed命令處理它? 輸出應為

http://www.google.com/
http://www.stackoverflow.com/

使用trgrep

tr '"' '\n' < URL_name.txt | grep http

可以使用Java。 您也可以嘗試以下命令:

  1. egrep -ie "<*HREF=(.*?)>" index.html | cut -d "\\"" -f 2 | grep ://
  2. egrep -ie "<*HREF=(.*?)>" index.html | awk -F\\" '{print $2}' | grep ://

您可以使用grep

grep -o 'http://[^"]*' yourfile

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM