繁体   English   中英

文件顶部带有附加内容的 JSON

[英]JSON with additional content at top of file

我正在尝试将此网址作为 JSON 读入 R: https ://comtrade.un.org/Data/cache/reporterAreas.json

我看到文件顶部还有其他内容,包装了我所追求的内容。 该文件的示例如下所示:

{
  "more": false,
  "results": [
    {
      "id": "all",
      "text": "All"
    },
    {
      "id": "4",
      "text": "Afghanistan"
    },
    {
      "id": "8",
      "text": "Albania"
    }
  ]
}

尝试阅读使用:

x <- GET(url)
fromJSON(rawToChar(x$content))

抛出错误不起作用: unexpected character '<ef>' 我假设这是看到[

我也尝试了download.file(url, file) ,调用fromJSON(file) ,但这引发了错误unexpected character 'r' ,我猜这是来自“结果”

我认为这只是 JSON 的一些标头格式(抱歉,我对 JSON 文件做的不多),并且可以选择通过GET()fromJSON()来处理它,但我看不到文档中的任何内容。 我见过的描述如何从 url 中提取 JSON 的示例都没有这种格式。

当我调用class(rawToChar(x$content))时,它显示为chr vector ,所以我可以清除它,消除{"more": false,"results": [ and ]} ,但这看起来像一种标准格式。

如果有人可以告诉我如何正确导入它,我会欢迎它。 也欢迎一个更有用的问题标题,它更有效地描述了这个问题。

<ef>字符是转换为 UTF-8 的字节顺序标记的第一个字节。 其他字节是<bb><bf>

当我使用download.file()下载文件然后使用jsonlite::read_json()对其进行解码时,它会发出有关 BOM 的警告,但似乎读取文件的其余部分而没有错误。 你应该试试。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM