cost 120 ms
将扫描的 PDF 转换为可搜索的 PDF(在 R 中) - Convert scanned PDF to searcheable PDF (in R)

我正在尝试使用tesseract和pdftools包将一系列扫描的 PDF 转换为可搜索的 PDF 。 我已经完成了两个步骤。 现在我需要写回一个可搜索的 pdf。 读取扫描 PDF 运行 OCR 写回可搜索的 PDF 或者,我可以在 R 中为 Windows 调用另一个 package 或命令行 ...

下载 NOAA 数据 - Downloading NOAA data

我正在尝试使用 rnoaa package 下载 NOAA 数据,但遇到了一些麻烦。 我从 dataframe 中获取了一个向量,它看起来像这样: 抓取必要的列这给了我一个 output 像: 实际上,我有大约 22,000 个气象站。 这只是显示前 50 个。 核酸编码 这会产生以下错误: Err ...

有什么方法可以将字符编码更改为其对应的英文 IN R? - Is there some way to change the characters encoding to its English equivalent IN R?

在 R 中,我使用 Tabulizer 库从 Pdf 表中提取数据,名称使用尼泊尔语,提取后我得到这个表 [1]: https://i.stack.imgur.com/Ltpqv.png 但现在我想改变第 2 列的名称,用它的英文等效 R有没有办法做到这一点我写的 R 代码是 ...

是否有任何 R 函数可以从物种分类 ID/物种名称或属名中提取所有分类名称(门、类、目、科...)? - Is there any R function to extract all taxonomy name (phylum, class, order, family ...) from species taxonomic ID/ species name or genus name?

我有物种的分类 ID,我可以从 NCBI ( https://www.ncbi.nlm.nih.gov/Taxonomy/TaxIdentifier/tax_identifier.cgi ) 获取物种和属名。 但我想从这些数据中获得门、类、目……。 我尝试过taxize package ,但不适用 ...

为什么 R 中的 textreuse packge 使 LSH 存储桶比原始 minhashes 大得多? - Why does textreuse packge in R make LSH buckets way larger than the original minhashes?

据我了解,LSH 方法的主要功能之一是数据减少,甚至超出底层哈希(通常是 minhashes)。 我一直在 R 中使用textreuse package,我对它生成的数据大小感到惊讶。 textreuse是经过同行评审的ROpenSci package,所以我认为它可以正常工作,但我的问题仍然存 ...

按路线类型提取开放街道地图道路 ID 的交叉路口计数 - Extract count of intersections for Open Street Map way IDs, by route type

编辑添加了额外的细节 我有一个包含 2,061 个开放街道地图 ( OSM ) 路段的 shapefile。 我的 shapefile 中的每个段都由其 OSM Way ID 标识。 以下是我的数据中五个细分的示例: 对于这 2061 个路段中的每一个,我想分别计算每种道路类型(住宅、初级、三 ...

如何创建计划目标以跨越先前地图目标和新变量的结果? - How to create a plan target to cross over the results of previous map targets and a new variable?

在使用map创建的多个目标( a )中,我有两个其他目标( b和d )遍历第一个目标。 现在,我想在另一个目标中使用这些目标的结果。 另外,我还要介绍另一个变量( model )。 我在下面粘贴了一个reprex,但在某些情况下, a描述了数据集的不同子集, b和d预计算了一些东西, ...

drake - 映射 ggplot 目标以输出它们 - drake - map over ggplot targets to output them

首先, drake很神奇。 我喜欢设计依赖图然后一举执行的工作流程。 然而,我遇到了障碍。 我的工作流程是模拟大型参数网格,然后总结所述网格的不同切片。 我想为每个这样的切片创建一个图。 如果我理解正确,我应该使用某种形式的cross->combine->map来实现这一点。 这是 ...

暂停Drake计划使其能够重建之前已经建立的目标 - Halting drake plan makes it rebuild targets it already had built previously

我目前正在使用drake来运行一组> 1k的模拟。 我估计运行全套软件大约需要两天时间,但是我也希望在此期间我的计算机在任何时候都崩溃,因为它确实有崩溃的可能。 显然,停止计划会丢弃已经建立的任何目标,因此从本质drake ,这意味着我不能将drake用于其预期目的。 我想我 ...

用purrr链接函数并引用嵌套变量 - linking functions with purrr and referencing nested variables

我正在从大型在线数据库(GBIF)抓取数据,这需要三个步骤:(1)将GBIF“键”标识符与物种名称匹配,(2)将查询发送到数据库,获得下载键(“ res”),以及(3)下载,导入和过滤与该物种相关的数据。 我为每个函数编写了一个函数(这里不包括实际代码,因为很长很长,并且需要登录凭据): ...

用R子集geojson数据 - Subsetting geojson data with R

我有一个状态边界的geojson文件,我从这里获得 。 特别是我正在使用2000万美国国家数据 我正在尝试对数据进行子集化,以便我可以使用传单仅映射某些状态。 我可以使用以下方法对单个状态进 这种方法似乎不适用于选择多个状态: 选择多个状态通常会导致仅选择一个或两个状态 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM