简体   繁体   English

如何从网页获取链接资源?

[英]How to get linked resource from a web page?

I'm writing a small application where I need to get the linked resources from a web page eg 我正在编写一个小型应用程序,需要从网页获取链接资源,例如

<link rel="EditURI" type="application/rsd+xml" title="RSD" href="http://name.wordpress.com/xmlrpc.php?rsd" /> 
<link rel="wlwmanifest" type="application/wlwmanifest+xml" href="http://name.wordpress.com/wp-includes/wlwmanifest.xml" />

the easiest way would be to parse the page and get what I wanted, but I'm looking best way to do it. 最简单的方法是解析页面并获得我想要的东西,但是我正在寻找最好的方法。

Is there any direct way to get RDS content? 有没有直接的方法来获取RDS内容? Any suggestions, please? 有什么建议吗?

If this is a small project and you already have working code to parse the page, use it. 如果这是一个小项目,并且您已经有可解析该页面的工作代码,请使用它。

If you are looking for a better/recommended way to parse the HTML of a page, consider using something more mature like the Html Agility Pack . 如果您正在寻找一种更好/推荐的方式来解析页面的HTML,请考虑使用更成熟的功能,例如Html Agility Pack

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM