标签[stanza] - 堆栈内存溢出

在带注释的文本上调用 .lower() 方法时出现 NoneType 错误 - NoneType erorr when calling .lower() method on annotated text

我在列表 (len=488) 中注释了文章，我想在引理上应用.lower()方法。我收到以下错误消息AttributeError: 'NoneType' object has no attribute 'lower' 。这是代码：我在变量annot_data中搜索了None ( print(a ...

Dask 分区或在 NLP 节预处理中延迟 - Dask Partitions or Delayed in a NLP Stanza preocess

我正在使用 Stanza 处理 NLP 流程。 Stanza 需要很长时间才能运行 NLP 进程，我知道我的问题很容易分区。我使用这些库我有以下 function 当我使用 pandas 或 dask delayed 运行代码时，我在执行时间方面得到了相同的结果。我也尝试用 map_part ...

awk：行尾与记录尾 - awk: end of line vs end of record

我试图匹配行尾的数字 ($)，打印相关段落并忽略第三段。这是数据：此命令仅匹配第一段： awk -v RS="" -v ORS="\n\n" "/number 200\n/" file 此命令仅匹配第二段： awk -v RS="" -v ORS="\n\n" "/number 200$/" f ...

如何从用户使用 Stanza 指定语言的 txt 中删除停用词 - How to remove stopwords from a txt where the user specifies the language using Stanza

我有很多这样的 .txt 文件：但是它们使用几种不同的语言，因此用户可以这样指定：我想删除所有停用词并将文本保存在另一个 .txt 文件中。我使用 Stanza 是因为我想稍后进行情绪分析，但我不知道如何使用它来删除停用词。我已经用 Spacy 尝试过它，因为它速度更快，但也无法管 ...

使用 stanford-nlp 列出超出范围的索引 - List index out of range with stanford-nlp

我试图从一个大的 .txt 文件中删除所有空行，但无论我使用什么方法，它总是返回这个回溯：如果我不删除这些空格，那么我会在随后的 2 个 for 循环中得到 IndexErrors（或者至少我认为这是原因），这就是我使用 try/except 的原因，如下所示：我希望能够删除所有空白行， ...

如何将 lossanza 回调传递给 C function？ - How to pass a lostanza callback to a C function?

我希望将lostanza function 传递给 C API，从 C 调用它。这是我当前的实现：与相应的 C 文件：我使用stanza callbacks.stanza -ccfiles call_from_c.c -o cbk编译此代码，但在运行它时我收到此错误消息：我需要做什么才能设 ...

在 String 中嵌入二进制值的最佳方法是什么 - What is the best way to embed binary value in String

我想使用转义来表示控制代码来构建带有终端颜色的消息。我可以使用类似... ？ ...

当与 C 接口时，如何在 lostanza 中表示 NULL 指针？ - How to represent NULL pointer in lostanza when interfaces with C?

此代码完美运行（暂时忽略颜色信息部分）但是C中的SDL_FillRect在pRect中接受了一个NULL的指针。我想我可以做到但它不起作用。在 lostanza 中强制使用 NULL 指针的做法是什么？ ...

如何定义别名类型？ - How to define an alias type?

路由被定义为 [String, String] 元组。将类型别名“Route”定义为 [String, String] 的最合适方法是什么？例如我想用反而。 ...

“HTTPConnectionPool(host='127.0.0.1', port=9000): [Errno 111] Connection denied” 加载 Stanford NLP model 时 AWS EMR 上的错误 - "HTTPConnectionPool(host='127.0.0.1', port=9000): [Errno 111] Connection refused" error on AWS EMR when loading Stanford NLP model

I am using the Stanford CoreNLP Model in an algorithm, which includes a Java client to the server, the (StanfordCoreNLPClient) in order to interact w ...

如何将 Stanza 导出为 ONNX 格式？ - How to Export Stanza to ONNX format?

如何将 Stanza 导出为 ONNX 格式？仅仅训练 model 似乎是不可能的。 ...

Stanza 没有像预期的那样标记句子；我可以使用换行符作为启发式吗？ - Stanza not tokenising sentences as expected; can I use newline character as a heuristic?

我正在尝试为单词 alignment 任务预处理我的文本数据。我有一个句子的文本文件。每个句子都换行：我正在使用 Stanza 来标记句子：我预期的 output 是：本质上，一个列表列表，每个句子都在自己的列表中，并且它的单词被标记化。但是，我得到的 output 是这样的：在某些 ...

为什么 Presidio StanzaNlpEngine 抛出 NameError: name 'StanzaLanguage' is not defined？ - Why does Presidio StanzaNlpEngine throw NameError: name 'StanzaLanguage' is not defined?

我正在尝试在 Presidio 中使用 Stanza 语言模型并遇到此拦截器。以上抛... 看着代码，这似乎应该可以工作。即使这会引发相同的错误。 ...

如何在节中的字符串中查找和替换字符？ - How do I find and replace characters in a string in stanza?

假设我有一个字符串val s = "_1.2V_ADC" 该句点对我的用例无效，所以我需要用另一个字符替换它，比如p所以最后的字符串应该是"_1p2V_ADC" 在 Stanza 中有什么简单的方法可以做到这一点吗？ ...

如何检查字符串是否为有效整数？ - How do I check if a string is a valid integer?

假设我有如何检查s可以解析为有效整数？ ...

您如何确保节 CoreNLPClient 有一个可行的端点？ - How can you ensure a viable endpoint for a stanza CoreNLPClient?

我想使用节 CoreNLPClient 来提取名词短语，类似于这种方法。但是，我似乎找不到启动服务器的好端口。默认是 9000，但是这个经常被占用，如错误信息所示： PermanentlyFailedException: 错误: 无法在端口 9000 上启动 CoreNLP 服务器（可 ...

减少格式化字符串中的冗长（Stanza） - Reducing Verbosity in formatted strings (Stanza)

我正在从一些基本字符串中为与正则表达式相关的操作制作许多字符串，我想知道是否有一种不那么冗长的方法来编写它。我有我的基本字符串：由这些构建的字符串：理想情况下，我可以写一些类似的东西 ...

第二次循环序列时为空序列 - Empty sequence when looping on a sequence for the second time

在节中，我想在一个序列上循环两次。我有类似的东西：和和在function1和function2中，我都在循环序列。但是当到达function2时，序列是空的。 ...

如果存在元组中的元素，如何找到它的索引？ - How do I find the index of an element in a Tuple if it exists?

说我有这个：是否有更简洁或更惯用的形式来搜索元组并返回项目的索引（如果存在）？ ...

节中的数字限制 - Numeric limits in stanza

在节中，我想获得 Int 和 Double 类型的数字限制（最小值和最大值）。在 C++ 中，有INT_MIN 、 INT_MAX 、 DBL_MIN和DBL_MAX 。 ...