我正在尝试使用 openNLP 来查看文本行并将句子分类到主题桶中。 这是一个示例df: 我已经将文本分成句子,然后使用以下代码搜索关键字: 然而,我的 for 循环并没有准确地打印出我正在寻找的内容。例如, print(stem_keyword) 给了我错误的关键字,用于错误的句子。 最后 ...
我正在尝试使用 openNLP 来查看文本行并将句子分类到主题桶中。 这是一个示例df: 我已经将文本分成句子,然后使用以下代码搜索关键字: 然而,我的 for 循环并没有准确地打印出我正在寻找的内容。例如, print(stem_keyword) 给了我错误的关键字,用于错误的句子。 最后 ...
R package openNLPmodels.en 曾经可以从https://datacube.wu.ac.at/src/contrib/openNLPmodels.en_1.5-1.tar.gz 获得,但是这个 url 不再有效......有谁知道如果它在其他地方可用? ...
我正在使用 openNLP 在整个文本中注释句子中的单词。 作为最终结果,我希望单词 ID 在每个句子中匹配它们的顺序,每次输入一个新句子时顺序从 1 开始)。 这是我到目前为止所拥有的: ID 类型 开始 结尾 ...
我正在尝试将 word 文档和 PDF 的内容发送到 Apache OpenNLP。 我想知道我是否可以使用 ActiveMQ 读取 MS word,以便我可以触发一个进程到 Apache Kafka 来处理 stream。 欢迎任何建议给 stream PDF 或 ActiveMQ 以外的词。 ...
我们可以将网站内容总结为 5 行吗? 在 JAVA 中使用 NLP 库? 我看到了用于开放 nlp 的 apache 库,但它们都没有谈到 5 行或某些行中的大文本的总结或结论? 我看到更多库如下,但它们会将文本摘要提供为小摘要吗? 1|Apache OpenNLP 2| 阿帕奇 UIM ...
我是 NLP 的新手,我正在使用 OpenNLP 研究 NER。 我有一句话像“我们今天有一个晚宴”。 这里的“晚宴”是一种事件类型。 同样考虑这句话——“我们有房间预订”,这里的房间预订是一种事件类型。 我的目标是从句子中提取这样的词,label 作为“Event_types”作为最终的 out ...
我正在尝试为 SOLR 设置 OpenNLP 功能,为此,我需要配置专用的 fieldType: 我将所需文件:en-sent.bin、en-token.bin、en-pos-maxent.bin 和 en-chunker.bin 放入正确的集合配置目录并触发: bin/solr.cmd zk ...
我正在使用 Apache 的 OpenNLP 编写命令解析器。 问题在于 OpenNLP 将某些命令视为名词短语。 例如,如果我解析“开门”之类的内容,OpenNLP 会给我(NP (JJ open) (NN door)) 。 换句话说,它将短语视为“敞开的门”而不是“敞开的门”。 我希望它解析为 ...
我在构建 Lemmatizer bin 文件时遇到问题。 根据这个答案,我应该运行opennlp LemmatizerTrainerME -model en-lemmatizer.bin -lang en -data /path/to/en-lemmatizer.dict -encoding UT ...
我正在尝试使用 flair nlp 框架, https://github.com/flairNLP/flair 但出现错误# load the NER tagger tagger = SequenceTagger.load('ner') 在本地、远程和其他机器上试过。 全部失败,因为它无法从 s ...
我正在评估 OpenNLP 用作文档分类器。 我有一个经过消毒的训练语料库,大约有 4k 个文件,大约有 150 个类别。 这些文档有许多共享的、大多是不相关的词——但其中许多词在 n-gram 中变得相关,所以我使用以下参数: 其中一些类别适用于几乎完全相同的文档(想想样板式的法律文档,文档实 ...
我正在使用 nlpcraft 构建一个用于调度的解析系统。 用户会被询问他们何时会进行某些活动,他们可以用相对或绝对日期来回答,例如“星期二和星期三”或“直到 8 月 15 日”。 虽然 nlpcraft 具有非常好的相对日期解析,但据我所知,它总是解析相对于 UTC 当前系统时间的日期。 这不仅使 ...
我正在运行带有 OpenNLP 命名实体识别器的 DKPRO UIMA 管道,运行以下模型:金钱、日期、位置、人员。 除了钱,他们都在工作。 货币项目被识别但被归类为日期。 这是我的管道的摘录。 我的 gradle 进口是 ...
在检查其显示属性错误的准确性时出现错误:-历史 object 没有属性“评估”。 我试图解决这个问题。AttributeError: 'History' object has no attribute 'evaluate' #编译RNN分类器.compile(optimizer='adam',l ...
我正在尝试将 Apache OpenNLP 与 Maven 一起使用。 我在 pom 中添加依赖项 当我运行以下代码创建 LanguageDetectorModel object } 我收到以下 NullPointerException 并且我不知道该怎么做。 我还尝试将 opennlp-too ...
我想在远程访问的 GPU 服务器上使用 CLI 训练 OpenNLP model。 我熟悉在训练 pytorch 模型时使用 GPU,但我意识到我不确定这将如何与 openNLP 一起使用,因为它是用 java 编写的。 如果我在一个上训练它,openNLP 会使用 GPU 吗? 具体来说,我在想 ...
我在我的项目中使用 open nlp。 我想使用字典 lemmatizer 但我无法正确输入 posModel 我有一个 summaryActivity class 调用这个 function 点击一个按钮 还有我的预处理器 class 初始化 posModel 的构造函数 这是我的 src 文件 ...
这是我第一次尝试使用 stackoverflow,而且我对 R 还是很陌生,所以如果我搞砸了任何格式,我深表歉意。 我目前正在尝试让实体识别命令在 openNLP package 中工作。 使用他们提供的示例,但是我仍然遇到错误。 请看下面的代码 作为错误返回: 请帮助我,我很困惑,因为我上周四运行 ...
我想为每个句子找到一个主语、动词和 object然后将其传递给自然语言生成库simpleNLG以形成一个句子。 我尝试了多个库,例如Cornlp、opennlp、Standford 解析器。 但我无法准确找到它们。 现在在最坏的情况下,我将不得不编写一长串 if-else 来查找每个句子的主语、动词 ...
我有我的 dockerized 容器,用于运行 elasticsearch 和 kibana,一旦我启动 docker 容器,它就会自动安装一些插件。 我需要编辑 config/elasticsearch.yml 文件以启用该插件的使用,我正在尝试找到完成它的方法,类似于我通过文件安装插件的方式, ...