繁体   English   中英

使用Perl提取脚本类型html /文本

[英]Using Perl to Extract script type html/text

我目前正在尝试提取脚本类型=“text / html”指向的页面。 例如, 此CNN链接在源中包含以下行:

<script type="text/html" id="pageTemplate"></script>

我想下载pageTemplate的内容并能够解析结果。 我一直在尝试使用HTML :: TagParser,我能够获得元素pageTemplate,但我无法得到它的内容。

因此,“pageTemplate”没有任何内容。 据推测,这是因为它将被用作某些HTML的藏匿处; “text / html”类型的脚本实际上没有做任何事情。 也就是说,像这样的<script>是一个未显示的DOM元素,可以用于任何目的。

一种可能性: http//ejohn.org/blog/javascript-micro-templating/

通过与CNN页面关联的javascript查看有关该id用于什么的线索。

显示内容

[英]displaying content of <script type=“text/html”

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM