簡體   English   中英

如何從C#獲取原始頁面源(非生成源)

[英]How to get raw page source (not generated source) from c#

目的是獲取頁面的原始資源,我的意思是不要運行腳本或讓瀏覽器完全格式化頁面。 例如:假設響應后的來源是<table><tr></table> ,我不想得到<table><tbody><tr></tr></tbody></table> ,如何通過C#代碼做到這一點?

更多信息:例如,在瀏覽器的地址欄中鍵入“ view-source:http://feeds.gawker.com/kotaku/full”將提供ua xml文件,但是如果您僅調用“ http://feeds.gawker .com / kotaku / full”,它將呈現一個html頁面,我想要的是xml文件。 希望這很清楚。

這是一種方法,但是還不清楚您真正想要什么。

using(var wc = new WebClient())
{
    var source = wc.DownloadString("http://google.com");
}

如果您的意思是在渲染自己的頁面時。 您可以使用ResponseFilter或通過覆蓋頁面渲染來訪問原始頁面內容。 我會質疑您這樣做的動機。

腳本在客戶端運行,因此與任何c#代碼無關。

您可以使用諸如Fiddler之類的工具來查看實際通過網絡發送的內容。

免責聲明:我認為Fiddler很棒

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM