繁体   English   中英

如何使用Wiki-data toolkit api提取人类可读的数据?

[英]How to extract human-readable data using Wiki-data toolkit api?

我正在使用wikidata来获取研究数据。

我的目标是每个给定的名字,例如Abdias Praetorius,获得实体的id,dob,出生地,性别等。

该页面是: https//www.wikidata.org/wiki/Q308161这似乎很容易。

但是当我使用wiki-data FetchOnlineDataExample.java代码并稍微修改它时。 然后我得到一些这样的信息:

{de=["Abdias Praetorius" (de), "Gottschalk Schultze" (de)]}
http://www.wikidata.org/entity/P21 :: http://www.wikidata.org/entity/Q6581097 (item)
http://www.wikidata.org/entity/P19 :: http://www.wikidata.org/entity/Q486985 (item)
http://www.wikidata.org/entity/P20 :: http://www.wikidata.org/entity/Q6837 (item)
http://www.wikidata.org/entity/P27 :: http://www.wikidata.org/entity/Q183 (item)
http://www.wikidata.org/entity/P214 :: "20740552"
http://www.wikidata.org/entity/P227 :: "128621761"
...

这很甜蜜。 因为它确实在网页中定义,例如“死亡之地”是页面中的项目:

http://www.wikidata.org/entity/P20

“Wittenberg”是页面中的一个项目:

https://www.wikidata.org/wiki/Q6837

我的问题是:有什么方法可以废弃“出生地:wittenberg”吗? 我知道只需抓取整个网页并阅读dom数据就可行了。 如果有更好的方法,我只是好奇。

您可以使用wbgetentities API来获取项目或属性的标签。 还有一个第三方API在后台使用维基数据,但结果格式更方便: http ://api.haykranen.nl/wikidata/entity?q = 308161

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM