[英]Importing XML Data into Google Sheets from a Web-based Source
我正在尝试构建一个Google Sheet,从通过AWS S3托管的IRS Form 990存储库中提取信息。
这是XML文件: 示例990 XML格式
我正在进行的查询旨在从XML源中提取Schedule I部分下的业务名称。 业务名称包含在BusinessNameLine1Txt
标记中。
利用Google Sheet内置的IMPORTXML
功能,我构建了以下内容:
=IMPORTXML("https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml", "//Return/ReturnData/IRS990ScheduleI/RecipientTable/RecipientBusinessName/BusinessNameLine1Txt")
当我使用上面的参数执行函数时,我收到一条错误消息,指出导入的内容为空。 我的XPATH查询不正确还是与数据中的某些怪癖有关?
这个修改怎么样?
=IMPORTXML(A1, "//*[local-name()='BusinessNameLine1Txt']")
https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml
放在“A1”中。 如果我误解了你的问题,请告诉我。 我想修改它。
=IMPORTXML(A1, "//*[local-name()='IRS990ScheduleI']//*[local-name()='BusinessNameLine1Txt']")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.