给定一列字符串,我想从网站(例如sciencedirect.com)中找到每个字符串的搜索结果数。 Excel的现有答案Number of Google Results适用于Google。

不幸的是,此解决方案从字符串创建搜索URL,即, 例如 Google搜索包含单词example 我要使用的网站不这样做。

例如,搜索返回URL http://www.sciencedirect.com/science?_ob=ArticleListURL&_method=list&_ArticleListID=1860967815&_sort=r&_st=13&view=c&_acct=C000053194&_version=1&_urlVersion=0&_userid=1495569&md5=0ef30742e917da15236ef18type058

不知道我如何用这种类型的搜索引擎获得相同的结果。

===============>>#1 票数:0 已采纳

单击“搜索”按钮时,您必须检查提交的表单。 表单发送一个包含搜索词的GET请求,但是随后您将重定向到结果列表页面,并且结果页面的URL不再包含搜索词。

我已经使用以下URL成功搜索了“语料库”:

http://www.sciencedirect.com/science?_ob=QuickSearchURL&_method=submitForm&_acct=C000228598&_origin=home&_zone=qSearch&md5=61ce8901b141d527683913a240486ac4&qs_all=corpus

请注意,您要做的是

  1. 下载起始页面http://www.sciencedirect.com/
  2. 从搜索表单中提取隐藏字段
  3. 从隐藏字段中组合搜索URL
  4. 将您的搜索词添加到qs_all字段的搜索URL中
  5. 发送带有搜索网址的GET请求
  6. 跟随重定向

除了qs_all之外,此URL中的所有其他字段都来自表单中的隐藏字段。 这是我下载时(在发送“语料库”搜索请求之前)相应表格的来源:

<form name="qkSrch" method="get" target="_top" action="/science" style="margin:0px;">
<input type="hidden" name="_ob" value="QuickSearchURL">
<input type="hidden" name="_method" value="submitForm">
<input type="hidden" name="_acct" value="C000228598">
<input type="hidden" name="_origin" value="home">
<input type="hidden" name="_zone" value="qSearch">
<input type="hidden" name="md5" value="61ce8901b141d527683913a240486ac4">

<table border="0" width="100%" cellpadding="0" cellspacing="0" style="margin: 0;">
<tbody><tr valign="middle">

<!-- Code related for toggling labels -->

   <td align="right"><label for="qs_all" id="fieldLabel">&nbsp;&nbsp;&nbsp;&nbsp;All fields</label></td>
   <td align="left"><input class="textbox qsinput xpstyle" type="text" name="qs_all" id="qs_all" value="" size="30" maxlength="450" title="For example: heart attack AND behavior?" tabindex="1"></td>



   <td align="right"><label for="qs_author">&nbsp;&nbsp;&nbsp;&nbsp;Author</label></td>
   <td align="left" colspan="5"><input class="textbox qsinput xpstyle" type="text" name="qs_author" id="qs_author" value="" size="33" maxlength="450" title="e.g. J S Smith or John Smith or Smith JS" tabindex="2" style="_width:100%"></td>
   <td nowrap="nowrap">

   </td><td></td><td></td>
   <td align="right" nowrap="nowrap" width="90%" valign="middle">
   <a href="/science?_ob=MiamiSearchURL&amp;_method=requestForm&amp;_btn=Y&amp;_acct=C000228598&amp;_version=1&amp;_urlVersion=1&amp;_userid=10&amp;md5=18a1082f74248d90d465ee65804fd7db" style="vertical-align:bottom;font-size:0.92em;">Advanced search</a>
   </td>
</tr>
<tr>

   <td align="right"><label for="qs_title">&nbsp;&nbsp;&nbsp;&nbsp;Journal/Book&nbsp;title</label></td>
   <td align="left"><input class="textbox qsinput xpstyle" type="text" id="qs_title" name="qs_title" value="" size="30" maxlength="450" title="For example: journal of molecular biology" tabindex="3"></td>

   <td align="right" class="toggleQukSrch2"><label for="qs_vol" id="volField">&nbsp;&nbsp;&nbsp;&nbsp;Volume</label></td>
   <td align="left" class="toggleQukSrch"><input class="textbox qsinput xpstyle" type="text" name="qs_vol" id="qs_vol" value="" size="3" maxlength="10" style="width:30px;" tabindex="4"></td>
   <td align="right" class="toggleQukSrch2"><label for="qs_issue" id="issueField">&nbsp;&nbsp;Issue</label></td>
   <td align="left" class="toggleQukSrch"><input class="textbox qsinput xpstyle" type="text" name="qs_issue" id="qs_issue" value="" size="3" maxlength="10" style="width:30px" tabindex="5"></td>
   <td align="right" class="toggleQukSrch2"><label for="qs_pages" id="pageField">&nbsp;&nbsp;Page</label></td>
   <td align="right" class="toggleQukSrch"><input class="textbox qsinput xpstyle" type="text" name="qs_pages" id="qs_pages" value="" size="3" maxlength="10" title="For example: 14-27" style="width:30px" tabindex="6"></td>

   <td align="right" nowrap="nowrap">
   <input class="button" id="submit_search" type="Submit" alt="Submit Quick Search" title="Submit Quick Search" value="Search ScienceDirect" tabindex="8" name="sdSearch">
   </td> 



 <td align="right" nowrap="nowrap" colspan="8" valign="bottom">
      <a class="icon_qmarkHelpsci_dir" href="/science?_ob=HelpURL&amp;_file=qs_tips.htm&amp;_acct=C000228598&amp;_version=1&amp;_urlVersion=0&amp;_userid=10&amp;md5=2bd779305b31602341744eaa786e2f0a" target="sdhelp" onmouseover="window.status='Help is Available';return true" onmouseout="window.status='';return true" onclick="var helpWin;helpWin=window.open('/science?_ob=HelpURL&amp;_file=qs_tips.htm&amp;_acct=C000228598&amp;_version=1&amp;_urlVersion=0&amp;_userid=10&amp;md5=2bd779305b31602341744eaa786e2f0a','sdhelp','scrollbars=yes,resizable=yes,directories=no,toolbar=no,menubar=no,status=no,width=760,height=570');helpWin.focus();return false" tabindex="9" style="font-size:0.92em;padding-right:0;">Search tips</a>
   </td>
   </tr>
</tbody></table>
</form>

编辑(续)如何从结果页提取结果数。

您的假设是正确的,您必须更改代码的其他部分,即提取结果数量值。

让我们继续前面的示例。 从“语料库”搜索时,您将在结果页面的源代码中找到以下行:

<input type="hidden" name="TOTAL_PAGES" value="2836">

然后,您将要提取2836。因此,您将搜索类似<input type="hidden" name="TOTAL_PAGES" value="的值,并在结束引号之前获取后续值。

我不会告诉您如何在VBA中进行编码,但这是基本的String操作,因此我希望您可以进行处理。

  ask by falcs translate from so

未解决问题?本站智能推荐:

1回复

在IE上使用Excel VBA按Enter键“按Enter键进行搜索”

我正在处理一个Web表单文本字段,当按下“ Enter”键时,它将开始对其内容进行搜索。 我知道如何启动所有其他事件侦听器,但是我无法使按下“ Enter”事件触发。 它未与其他事件一起列出。 即onchange,onclick,onblur 我正在使用CreateObject(
2回复

Excel宏可使用Excel数据搜索网站并提取特定结果,然后循环查找下一个值

我希望有人可以提供帮助。 我在excel电子表格中有8000个值,需要在网站中进行搜索,然后记录该网站中的特定数据行,以将其输入回excel电子表格中。 我找到了以前的文章,该文章搜索我在excel宏中查找的数据以搜索网站并提取结果 代码是; 但是,当我运行Exc
1回复

使用Excel VBA使用搜索框,触发click事件并检索结果?

在搜索了我可以找到的关于该主题的每个主题之后,一次又一次地遇到错误,我来这里是希望有人能为我提供帮助。 我正在尝试利用该网站https://azredistricting.org/districtlocator/来搜索地址,该地址将返回立法/国会区域。 我尝试了以下代码的变体:
1回复

Excel Web抓取以在Google中搜索项目并将Print Screen转换为Word

我正在尝试从excel搜索一些值,并将大写屏幕粘贴到word文件中。 仅搜索一项时,它可以正常工作。 但我想知道是否可以搜索列表并将其全部粘贴到word文件中。 我试图对下面的代码进行循环,但似乎只能搜索A1 A2,或者完全无法工作。 即使设法搜索了A2,它仍然无法将屏幕截图粘
1回复

使用具有Excel数据的excel vba搜索网站,并在搜索结果流程图中提取活动状态并将其映射到列中

我希望有人可以提供帮助。 我需要在一个网站中搜索excel电子表格中大约有7000个值,然后记录该网站的结果流程图的活动状态,然后将其输入到excel电子表格中。 由于我是宏网站抓取的新手,因此我曾经为要提取信息的网站( https://nacionalidade.justica.gov.pt/
1回复

Excel Web抓取

我在使用Excel进行网络抓取时遇到问题。 我需要以下网站的数据:charitynavigator.org 我正在对以下链接列表进行测试: http : //www.charitynavigator.org/index.cfm?bay= search.results& cgid=7&
2回复

VBA Excel抓取

我开始尝试学习刮擦。 我得到的该页面位于登录名后面,我记得读过,您不应该尝试在通过标记名获取元素之后尝试执行(1),(2)或(3)的操作。 但是,您应该获得更独特的东西,例如Classname或ID。 但是有人可以告诉我为什么 这个GetTag的工作原理 此GetClass
1回复

Excel废料表

我是excel vba中的新手。 我有这个问题: 我想让excel检查项目的可用性@ www.bgstechnic.com/availability 例如“ 1195” 我写了这个vba: 我的问题是,我只需要在Excel中插入“ 库存商品,可用数量超过50件 ”部分
1回复

用Excel下载表格

我想下载此页面中有关伦敦银行同业拆借利率的表格: http://online.wsj.com/mdc/public/page/2_3020-libor.html (具体来说,是关于USD的那个) 通过使用从Web进行数据/导入,如果我按下导入后选择了表格,它不会出现在表格中,但是如果
1回复

通过网络抓取Excel

我想将所有这些表中的6个都从该网站中提取到我的工作簿中。 (vs全部,vs PG,vs SG,vs SF,vs PF,vs C)当我尝试使用excel中的from web选项并选择表时,它只是拉入标题。 这是为什么? 目前,我有一个“立即粘贴”按钮,然后转到网站,将其复制并单击使用宏创建的