cost 151 ms
如何设置 Spark NLP 的 Tokenizer() 函数以逗号分割标记? - How to set Tokenizer() function of Spark NLP to split tokens by comma?

我正在 Spark NLP(版本 3.2.1)中构建一个管道,以从一个字符串列创建令牌,该字符串列包含按逗号分隔的搜索词。 但它给了我错误的预期输出。 例如,包含这些搜索词的行 回报: 但我希望它忽略空格并给我以下输出: 我怎样才能达到这个结果? ...

TypeError: 'JavaPackage' object 不可调用 | 使用来自 spark-nlp-m1_2.12 的 java 11 用于 spark 3.3.0、sparknlp 4.0.1 和 sparknlp jar - TypeError: 'JavaPackage' object is not callable | using java 11 for spark 3.3.0, sparknlp 4.0.1 and sparknlp jar from spark-nlp-m1_2.12

火花 nlp jar,我从https 那里得到它://jar-download.com/artifacts/com.johnsnowlabs.nlp.nlp.12/-m-40.p-11 JAVA_HOME = C:\Program Files\Java\jdk-18.0.1.1 在系统变量和用户 ...

Spark NLP 在 PySpark 中不工作:TypeError: 'JavaPackage' object is not callable - Spark NLP is not working in PySpark: TypeError: 'JavaPackage' object is not callable

我正在尝试 spark-submit 一个 PySpark 应用程序,但每次我尝试它都会在它尝试从 Spark NLP 下载预训练的 model 时抛出此错误: TypeError: 'JavaPackage' object is not callable 知道是什么原因造成的吗? 此外,有趣的是 ...

尝试在 spark dataframe 上使用 johnsnow 预训练管道,但无法读取同一 session 中的增量文件 - trying to use johnsnow pretrained pipeline on spark dataframe but unable to read delta file in the same session

我正在使用以下代码从 hdfs 读取火花 dataframe: 和下面的代码使用预训练管道: 我希望合并这两个代码,但两个 spark 会话没有合并或不能同时处理这两个任务。 请帮忙! 我尝试合并两个 spark 会话的 the.config() 选项,但它没有用我也尝试创建两个 spark 会话, ...

是否可以将 Spark-NLP 库与 Spark Structured Streaming 一起使用? - Is it possible to use the library Spark-NLP with Spark Structured Streaming?

我想对从 Kafka 集群获得的消息流执行推文情感分析,然后从 Twitter API v2 获取推文。 当我尝试应用预训练的情绪分析管道时,我收到一条错误消息: Exception: target must be either a spark DataFrame, a list of strin ...

SparkNLP PipelineModel,分阶段包含 AnnotatorApproach - SparkNLP PipelineModel which includes AnnotatorApproach in stages

在 SparkNLP 的PipelineModel中,所有阶段都必须是AnnotatorModel类型。 但是,如果其中一个注释器模型需要数据集中的某个列作为输入,并且该输入列是AnnotatorApproach的 output 怎么办? 例如,我有一个训练有素的 model 用于 NER(作为管 ...

如何在数据块上使用带有火花 nlp 的拥抱面变压器微调的 NER 模型 - How to use NER model fine tuned using hugging face transformers with spark nlp on databricks

我需要训练(微调)NER 标记分类器来识别我们的自定义标记。 我发现最简单的方法是: 使用 W-NUT 新兴实体进行令牌分类 但是现在我遇到了一个问题 - 计划是遵循: Spark NLP 中的 HuggingFace - BERT Sentence.ipynb ,但是当我尝试时: 我收到文件写 ...

Sparknlp Java 尝试显示 Model 结果时出错 - Sparknlp Java Error While Trying to Display Model Results

我正在尝试 output 使用 Spark-NLP 创建的练习 NLP model 的结果。 但是,我不断收到以下错误。 有人可以帮我从这里出去吗。 当我尝试 output dataframe 时,.show() 方法在代码的前面起作用。每当我尝试 output model 结果的任何部分时,它都会 ...

py4j.protocol.Py4JNetworkError:来自 Java 的答案为空 - py4j.protocol.Py4JNetworkError: Answer from Java side is empty

这是我在 Google Colab 上使用的代码。 它一直卡在 model.fit 部分并抛出此异常。 我无法在任何地方找到任何解决方案。 memory 在 Colab 上似乎也很高,开始认为 spark nlp 库中存在 memory 泄漏。 错误: ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM