[英]getting data from website using C#/vb.net
我有一個具有以下結構的XML:
<table name="tblsiccodes">
<row>
<sSICCode>0888</sSICCode>
</row>
<row>
<sSICCode>0900</sSICCode>
</row>
<row>
<sSICCode>1000</sSICCode>
</row>
<row>
<sSICCode>1040</sSICCode>
</row>
<row>
<sSICCode>1044</sSICCode>
</row>
<row>
<sSICCode>1090</sSICCode>
</row>
<row>
<sSICCode>1220</sSICCode>
</row>
<row>
<sSICCode>1221</sSICCode>
</row>
</table>
我需要從該站點選擇每個SIC代碼的描述
http://www.epa.gov/enviro/html/sic_lkup.html
或這個網站
http://www.sec.gov/info/edgar/siccodes.htm
使用vb.net從網站獲取每個SIC的描述的最簡單方法是什么? 我無法修改此XML文件。 我是否需要創建一個帶有SIC代碼和手動復制到其說明的集合,然后通過將SIC代碼與集合相匹配來獲得XMl中SIC代碼的描述? 最終集合將用於填充具有SIC代碼和行業名稱的每個項目/行的中繼器。
我需要刮屏嗎? 我認為這些網站沒有提供一些API /服務,因此我可以使用這些API /服務獲得行業名稱
除了Jquery,我不能使用HTMl敏捷包或任何其他第三方庫。
請提出建議。
查看第一頁的源代碼,其中包含以下選擇:
<select>
<option value=''> NO SIC CODE SELECTED </option>
<option value='3291'> ABRASIVE PRODUCTS (SIC Code: 3291) </option>
(...)
</select>
所以它繼續。
您可以將select的所有選項另存為另一個xml文件,然后使用XDocument或.net的任何其他Xml加載功能(無論是c#還是vb.net)遍歷ur文檔,並通過該值查找每個SIC代碼包含所有視標的xml中的value屬性。
當然,這可能不是最快的方法,但最容易實現。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.