繁体   English   中英

使用R XML包从RSS Feed中提取全文

[英]Pull full text from RSS Feed using R XML package

嗨,我目前正在尝试从RSS供稿中提取全文: http ://www.hu-berlin.de/pr/nachrichten.rss?cat=exz。 显示的只是简短说明和全文链接:

<item>
    <guid>http://www.hu-berlin.de/pr/nachrichten/nr1305/nr_130524_00</guid>
     <title>KOSMOS Summer University 2013 </title>
     <link>http://www.hu-berlin.de/pr/nachrichten/nr1305/nr_130524_00</link>
     <description>Frist verlängert: Anmeldung zum internationalen Forschertreffen bis 30. Juni möglich</description>
     <pubDate>Thu, 20 Jun 2013 00:00:00 +0200</pubDate>
  </item>

我可以使用xmlTreeParse完全像R那样获得它

我想知道天气是否有可能使用我发现的XML库直接在R中提取全文: 使用XML packagin R解析RSS feed ,尽管它工作正常,但对全文问题没有帮助。 我找到了rss-to-full-texr转换器(例如: http ://fulltextrssfeed.com/),这正是我所需要的,但我无法实现。 也许这会帮助其他人寻找相同的东西,或者没有人需要研究它,因为在这种情况下它是如此基础,很抱歉让您感到困扰。 我将不胜感激任何帮助或有用的链接!

全文心不是在 RSS提要的XML数据。 您必须获取链接,获取该网页,然后使用R的HTML解析工具(在其他地方对此进行了详细介绍)进行解析。

RSS被设计为摘要格式,然后人们应该进入网页。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM