当我查询 osm 数据时,我想收到时间戳,当添加或更改某些 object 时,是否可以包含此数据? 有我的查询: 然后我使用q$osm_polygons数据。 一般来说,我想将此脚本转换为 R: ...
我的主要目标是使用标题和期刊名称提取文章的元数据。 为此,根据博客https://ropensci.org/blog/2013/03/15/r-metadata/ rmetadata用。 但是,我无法使用install_github() function 安装 package。 有什么帮助吗? 谢 ...
我正在尝试使用tesseract和pdftools包将一系列扫描的 PDF 转换为可搜索的 PDF 。 我已经完成了两个步骤。 现在我需要写回一个可搜索的 pdf。 读取扫描 PDF 运行 OCR 写回可搜索的 PDF 或者,我可以在 R 中为 Windows 调用另一个 package 或命令行 ...
我正在尝试使用 rnoaa package 下载 NOAA 数据,但遇到了一些麻烦。 我从 dataframe 中获取了一个向量,它看起来像这样: 抓取必要的列这给了我一个 output 像: 实际上,我有大约 22,000 个气象站。 这只是显示前 50 个。 核酸编码 这会产生以下错误: Err ...
在 R 中,我使用 Tabulizer 库从 Pdf 表中提取数据,名称使用尼泊尔语,提取后我得到这个表 [1]: https://i.stack.imgur.com/Ltpqv.png 但现在我想改变第 2 列的名称,用它的英文等效 R有没有办法做到这一点我写的 R 代码是 ...
我有物种的分类 ID,我可以从 NCBI ( https://www.ncbi.nlm.nih.gov/Taxonomy/TaxIdentifier/tax_identifier.cgi ) 获取物种和属名。 但我想从这些数据中获得门、类、目……。 我尝试过taxize package ,但不适用 ...
我试图只获取从 osmdata 返回的非 na 值。 例如,以电子邮件地址为例。 但是,以下返回大部分丢失的电子邮件。 如何设置查询以使其仅返回非缺失值... value = "!null"也不起作用。 ...
据我了解,LSH 方法的主要功能之一是数据减少,甚至超出底层哈希(通常是 minhashes)。 我一直在 R 中使用textreuse package,我对它生成的数据大小感到惊讶。 textreuse是经过同行评审的ROpenSci package,所以我认为它可以正常工作,但我的问题仍然存 ...
编辑添加了额外的细节 我有一个包含 2,061 个开放街道地图 ( OSM ) 路段的 shapefile。 我的 shapefile 中的每个段都由其 OSM Way ID 标识。 以下是我的数据中五个细分的示例: 对于这 2061 个路段中的每一个,我想分别计算每种道路类型(住宅、初级、三 ...
在使用map创建的多个目标( a )中,我有两个其他目标( b和d )遍历第一个目标。 现在,我想在另一个目标中使用这些目标的结果。 另外,我还要介绍另一个变量( model )。 我在下面粘贴了一个reprex,但在某些情况下, a描述了数据集的不同子集, b和d预计算了一些东西, ...
问题 我正在寻找一种快速(理想情况下是恒定时间)的方法来在 R 中获取一个大切片的长原始向量。例如: obj <- raw(2^32) obj[seq_len(2^31 - 1)] 即使使用 ALTREP,基础 R 也需要很长时间。 system.time(obj[seq_len(2^31 ...
我正在R Shiny中开发一个小型应用程序。 该应用程序的一部分将需要查询GBIF以下载物种发生数据。 使用rgbif可以rgbif 。 函数rgbif::occ_download()将下载数据,而rgbif::occ_download_meta()将检查GBIF是否已满足您的要求。 例 ...
首先, drake很神奇。 我喜欢设计依赖图然后一举执行的工作流程。 然而,我遇到了障碍。 我的工作流程是模拟大型参数网格,然后总结所述网格的不同切片。 我想为每个这样的切片创建一个图。 如果我理解正确,我应该使用某种形式的cross->combine->map来实现这一点。 这是 ...
题 在igraph R包中,是否有一个有效的subcomponent()和/或BFS实现可以处理多个源顶点? 动机 drake R软件包将用户的工作流模型化为相互依赖的对象和文件的DAG。 DAG应该只包含用户的目标及其上游依赖项,因此drake使用igraph::subco ...
我目前正在使用drake来运行一组> 1k的模拟。 我估计运行全套软件大约需要两天时间,但是我也希望在此期间我的计算机在任何时候都崩溃,因为它确实有崩溃的可能。 显然,停止计划会丢弃已经建立的任何目标,因此从本质drake ,这意味着我不能将drake用于其预期目的。 我想我 ...
我正在使用R库Solrium使用Solr 连接到变量conn1中的solr之后,我进行如下查询: solr_search(conn1,"collection_name", params = list(q = "price:1000",start = 0, rows = 200 ...
我正在使用drake创建多个输出文件,我想通过变量指定路径。 就像是 但是file_out似乎不适用于除了文字字符之外的赋予它的参数。 给出一个小代码示例: 代码设置 工作守则 直接指定文件: 失败的代码 使用file.path构造outfile ...
我正在从大型在线数据库(GBIF)抓取数据,这需要三个步骤:(1)将GBIF“键”标识符与物种名称匹配,(2)将查询发送到数据库,获得下载键(“ res”),以及(3)下载,导入和过滤与该物种相关的数据。 我为每个函数编写了一个函数(这里不包括实际代码,因为很长很长,并且需要登录凭据): ...
我有一个状态边界的geojson文件,我从这里获得 。 特别是我正在使用2000万美国国家数据 我正在尝试对数据进行子集化,以便我可以使用传单仅映射某些状态。 我可以使用以下方法对单个状态进 这种方法似乎不适用于选择多个状态: 选择多个状态通常会导致仅选择一个或两个状态 ...