[英]JSON with additional content at top of file
我正在尝试将此网址作为 JSON 读入 R: https ://comtrade.un.org/Data/cache/reporterAreas.json
我看到文件顶部还有其他内容,包装了我所追求的内容。 该文件的示例如下所示:
{
"more": false,
"results": [
{
"id": "all",
"text": "All"
},
{
"id": "4",
"text": "Afghanistan"
},
{
"id": "8",
"text": "Albania"
}
]
}
尝试阅读使用:
x <- GET(url)
fromJSON(rawToChar(x$content))
抛出错误不起作用: unexpected character '<ef>'
。 我假设这是看到[
。
我也尝试了download.file(url, file)
,调用fromJSON(file)
,但这引发了错误unexpected character 'r'
,我猜这是来自“结果”
我认为这只是 JSON 的一些标头格式(抱歉,我对 JSON 文件做的不多),并且可以选择通过GET()
或fromJSON()
来处理它,但我看不到文档中的任何内容。 我见过的描述如何从 url 中提取 JSON 的示例都没有这种格式。
当我调用class(rawToChar(x$content))
时,它显示为chr vector
,所以我可以清除它,消除{"more": false,"results": [
and ]}
,但这看起来像一种标准格式。
如果有人可以告诉我如何正确导入它,我会欢迎它。 也欢迎一个更有用的问题标题,它更有效地描述了这个问题。
<ef>
字符是转换为 UTF-8 的字节顺序标记的第一个字节。 其他字节是<bb><bf>
。
当我使用download.file()
下载文件然后使用jsonlite::read_json()
对其进行解码时,它会发出有关 BOM 的警告,但似乎读取文件的其余部分而没有错误。 你应该试试。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.