簡體   English   中英

使用C#/ vb.net從網站獲取數據

[英]getting data from website using C#/vb.net

我有一個具有以下結構的XML:

<table name="tblsiccodes">
    <row>
        <sSICCode>0888</sSICCode>
    </row>
    <row>
        <sSICCode>0900</sSICCode>
    </row>
    <row>
        <sSICCode>1000</sSICCode>
    </row>
    <row>
        <sSICCode>1040</sSICCode>
    </row>
    <row>
        <sSICCode>1044</sSICCode>
    </row>
    <row>
        <sSICCode>1090</sSICCode>
    </row>
    <row>
        <sSICCode>1220</sSICCode>
    </row>
    <row>
        <sSICCode>1221</sSICCode>
    </row>
</table>

我需要從該站點選擇每個SIC代碼的描述

http://www.epa.gov/enviro/html/sic_lkup.html

或這個網站

http://www.sec.gov/info/edgar/siccodes.htm

使用vb.net從網站獲取每個SIC的描述的最簡單方法是什么? 我無法修改此XML文件。 我是否需要創建一個帶有SIC代碼和手動復制到其說明的集合,然后通過將SIC代碼與集合相匹配來獲得XMl中SIC代碼的描述? 最終集合將用於填充具有SIC代碼和行業名稱的每個項目/行的中繼器。

我需要刮屏嗎? 我認為這些網站沒有提供一些API /服務,因此我可以使用這些API /服務獲得行業名稱

除了Jquery,我不能使用HTMl敏捷包或任何其他第三方庫。

請提出建議。

查看第一頁的源代碼,其中包含以下選擇:

<select>
   <option value=''> NO SIC CODE SELECTED </option>
   <option value='3291'> ABRASIVE PRODUCTS (SIC Code: 3291) </option>
   (...)
</select>

所以它繼續。
您可以將select的所有選項另存為另一個xml文件,然后使用XDocument或.net的任何其他Xml加載功能(無論是c#還是vb.net)遍歷ur文檔,並通過該值查找每個SIC代碼包含所有視標的xml中的value屬性。
當然,這可能不是最快的方法,但最容易實現。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM