cost 264 ms
如何从用户使用 Stanza 指定语言的 txt 中删除停用词 - How to remove stopwords from a txt where the user specifies the language using Stanza

我有很多这样的 .txt 文件: 但是它们使用几种不同的语言,因此用户可以这样指定: 我想删除所有停用词并将文本保存在另一个 .txt 文件中。 我使用 Stanza 是因为我想稍后进行情绪分析,但我不知道如何使用它来删除停用词。 我已经用 Spacy 尝试过它,因为它速度更快,但也无法管 ...

使用 stanford-nlp 列出超出范围的索引 - List index out of range with stanford-nlp

我试图从一个大的 .txt 文件中删除所有空行,但无论我使用什么方法,它总是返回这个回溯: 如果我不删除这些空格,那么我会在随后的 2 个 for 循环中得到 IndexErrors(或者至少我认为这是原因),这就是我使用 try/except 的原因,如下所示: 我希望能够删除所有空白行, ...

“HTTPConnectionPool(host='127.0.0.1', port=9000): [Errno 111] Connection denied” 加载 Stanford NLP model 时 AWS EMR 上的错误 - "HTTPConnectionPool(host='127.0.0.1', port=9000): [Errno 111] Connection refused" error on AWS EMR when loading Stanford NLP model

I am using the Stanford CoreNLP Model in an algorithm, which includes a Java client to the server, the (StanfordCoreNLPClient) in order to interact w ...

Stanza 没有像预期的那样标记句子; 我可以使用换行符作为启发式吗? - Stanza not tokenising sentences as expected; can I use newline character as a heuristic?

我正在尝试为单词 alignment 任务预处理我的文本数据。 我有一个句子的文本文件。 每个句子都换行: 我正在使用 Stanza 来标记句子: 我预期的 output 是: 本质上,一个列表列表,每个句子都在自己的列表中,并且它的单词被标记化。 但是,我得到的 output 是这样的: 在某些 ...

您如何确保节 CoreNLPClient 有一个可行的端点? - How can you ensure a viable endpoint for a stanza CoreNLPClient?

我想使用节 CoreNLPClient 来提取名词短语,类似于这种方法。 但是,我似乎找不到启动服务器的好端口。 默认是 9000,但是这个经常被占用,如错误信息所示: PermanentlyFailedException: 错误: 无法在端口 9000 上启动 CoreNLP 服务器(可 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM