繁体   English   中英

Haskell处理Javascript“单击”以获取链接

[英]Haskell processing of Javascript “click” to get the link

乡亲。 也许您可以解决以下问题(一些解决方法很好)。

我需要从Google学术搜索中自动加载BibTex记录(或其他具有完整作者列表和期刊/书籍/等名称的记录)。 到目前为止,我可以形成一个请求URL并下载搜索结果页面(例如,像这样的一个页面: http : //bit.ly/1ddg1re )。 要获取BibTex记录,请在此页面上单击Cite链接(据我所知是JavaScript),然后单击“ 导入到BibTex ”链接(这是指向包含BibText记录的文本的常规GET链接)。

因此,我可以从通常的GET URL加载页面,但是我的问题是在Haskell中执行此操作“单击JavaScript链接并获取结果页面”。 有什么建议吗?

  1. 在首页上搜索您感兴趣的出版物的“引用”链接。 在您提供的示例中,它看起来像这样:

    <a onclick="return gs_ocit(event,'gwx5nEs8alwJ','0')" ...>Cite</a>

    gs_ocit的第二个参数是ID ,第三个参数是SCIRP

  2. http://scholar.google.com/scholar?q=info:<ID>:scholar.google.com/&output=cite&scirp=<SCIRP>&hl=en替换<ID><SCIRP>发出GET HTTP请求与上一步中获得的值相同。

  3. 搜索“导入BibTex”链接。 它将类似于以下内容:

    <a ... href="/scholar.bib?q=info:gwx5nEs8alwJ:scholar.google.com/&amp;output=citation&amp;scisig=AAGBfm0AAAAAUqhCtMOkKUkPe4VNc7E6kPW-SRLxTbBL&amp;scisf=4&amp;hl=en">Import into BibTeX</a>

    获取href属性中的URL,向其发出GET请求,就完成了。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM