我有一个看起来像这样的 Ruta 规则,其中 dep 是 DKPro 导入的依赖类型。 前两个动作有效。 我遇到的问题是在第三个动作SETFEATURE("Parent", dep.Governor)中。 dep.Governor 返回一个 Token 类型,但我的功能需要另一种恰好与 Gover ...
我有一个看起来像这样的 Ruta 规则,其中 dep 是 DKPro 导入的依赖类型。 前两个动作有效。 我遇到的问题是在第三个动作SETFEATURE("Parent", dep.Governor)中。 dep.Governor 返回一个 Token 类型,但我的功能需要另一种恰好与 Gover ...
我正在尝试使用分析管道运行 RUTA 脚本。 我将脚本添加到管道中,就像这样createEngineDescription(RutaEngine.class, RutaEngine.PARAM_MAIN_SCRIPT, "mypath/myScript.ruta) 我的 ruta 脚本文件包含以下内 ...
我正在运行带有 OpenNLP 命名实体识别器的 DKPRO UIMA 管道,运行以下模型:金钱、日期、位置、人员。 除了钱,他们都在工作。 货币项目被识别但被归类为日期。 这是我的管道的摘录。 我的 gradle 进口是 ...
我用 DkPro 尝试了 German Novel 。 我的示例输入文件是一个 XHTML 文件。 如何根据 XHTML 索引获取我的 PosTagger output。 脚本: 样本输入 在示例脚本中,uima.tcas.DocumentAnnotation 被发送到 PosTagger Pro ...
DKpro 中已经有很多标记器,例如斯坦福、opennlp 等,但我想知道如何在 DKpro-core 中实现 Fair NER 标记器? ...
在GSCL 2013 Ruta 教程中,pom.xml 中的组件版本为: 现在,我递增版本号,发现 DKPro 组件的 1.8.0 版本引入了以下异常: 在过去的几天里,我遇到了这些组件的其他版本问题(参见这个问题)。 有人能告诉我这些组件的最新版本是一起工作的吗? 或者也许有人可以给我他/她目前 ...
我正在建立一个基于UIMA和DKPro-Core的新框架。 该框架提供了一种配置UIMA管道的简便方法。 在某些JCasAnnotator内部,我想成对或与单个JCas比较所有文档(在这种情况下,我假设是不同的JCas对象)的JCas 。 里面similarityPipeline ...
即使在UIMA和uimaFIT中,DKPro Core我也是新手。 我正在尝试运行一个项目,但出现错误:Java代码中使用了JCas类型“ de.tudarmstadt.ukp.dkpro.core.discourse.pdtb.DiscourseArgument ”,但未在XML类型描述符中 ...
我想使用TreeTagger在uima管道内对德语文本进行分块。 当我使用cmd启动Tagger时,分块工作正常,但在管道中使用时会导致以下错误: 我想我应该指定参数“ Chunk_Mapping_Location”,但是我不知道哪个文件。 分块器通过以下方式初始化: ...
我正在尝试在 RUTA 工作台中使用 DKPro 核心组件,如下面的德国小说示例所示: https : //github.com/pkluegl/ruta Maven 从 DKPro Core 正确获取依赖项。 虽然我可以在 Eclipse 中执行主 ruta 脚本并在输出目录中获取 xmi ...
如何在DKPro Core中从多个文件训练一个模型? 用WebAnno注释了许多文档并以XMI格式导出后,我尝试使用以下代码创建模型: 问题是,尽管它确实打开了多个带注释的文件,但仅训练了一个文件。 ...
基于此问题,我需要以XMI格式导出并使用DKPro Core转换为Brat格式: https://github.com/webanno/webanno/issues/328 我尝试了此代码,但没有成功 ...
我想用dkpro相似度( https://dkpro.github.io/dkpro-similarity/ )计算字符串之间的相似度,它的工作原理如下: 我使用这样的课程: 我使用LexicalSemanticResource作为比较资源,可以是wordnet,Wikipedi ...
我从头创建并执行了德文小说示例项目。 输出包含诸如Lemma&Token之类的标签,但找不到提供该令牌的语音信息的任何功能。 如何获得? ...
这个问题描述了如何在dkpro中重用管道,但是如果我仅创建一个JCas,然后尝试更改文本,则会得到异常 org.apache.uima.cas.CASRuntimeException: Data for Sofa feature setLocalSofaData() has already ...
我将GermanNovel示例项目(基本上从https://github.com/apache/uima-ruta/releases的uima-ruta版本之一下载)导入到Eclipse中作为maven项目。 我将其导入为maven,因为找到了pom.xml文件。 我在Main.r ...
我已将DKPro Core设置为Web服务,以获取输入并提供令牌化输出。 服务本身设置为Jersey资源: 一切正常,但速度非常慢,每次输入需要7-10秒。 我假设这是因为正在为每个请求重新创建管道。 如何重新编写代码以将管道创建移动到构造函数并减少单个请求的负载? 请注意, ...
我正在尝试建立一个管道,该管道生成残化的句子。 我知道如何获得所有句子或所有引理,但是我不知道如何获得引理除以句子结尾的集合。 这是一个缺少参数的代码片段,用??????标记 : 我需要在此代码中进行哪些更改,以便它在两行中从两个输入语句中打印出引理。 ...
我已经研究了默认的UIMA Ruta Workbench Eclipse项目,足以明显地了解它的移动部分 - 例如,为什么input/ output/文件夹的行为与它们一样,如何使用jcasgen和其他Maven插件完成项目等。 但即使经过几个小时的研究项目并与Maven一起试图让它发挥作 ...