繁体 English 中英

使用XSLT进行单词和短语计数

[英]Word and phrase counting with XSLT

原文 2018-07-24 16:06:26 7 1 xml/ xslt/ word/ dita/ phrases

我们想建立一个公司产品文档的字典，创建一个固定的术语，因此我们要计算特定单词和短语的出现频率。

可以通过几种不同的方式解决此问题，但是我们想以某种方式解决的问题是编写一种XSLT算法，该算法可以识别短语，因为特定的单词经常一起出现（因此我们不必事先指定所有短语和所有版本的字词都有不同的变化，修饰词等）。

您如何看待，可以使用XSLT完成此任务，还是应该照顾其他解决方案？

如果有人对我们应该如何开始有任何有用的建议，我将非常高兴听到您的想法并进行讨论！

您正在寻找搭配，它在算法上与Pointwise互信息链接。

在XSLT中，没有用于自然语言处理（NLP）的框架，因此您必须发明一个框架。 不过，也有NLP框架编程语言，如Python的NLTK。 查看此示例以使用Python查找搭配。

使用以流行的数据挖掘语言（例如Python或R）编写的外部应用程序可能是最简单的。（您甚至可以将其插入DITA OT处理中。）您还可以考虑使用现有解决方案的供应商。 我没有对此进行任何深入的搜索，但是我已经看到Watson，Semaphore甚至XDocs之类的系统从语言分析中返回结果。

[英]Counting a subset in xslt

[英]Counting using XSLT

[英]XSLT counting child nodes

[英]Counting values in Xslt

[英]Counting with variable/unknown values XSLT

[英]XSLT counting elements with a matching value

[英]XSLT — Counting attributes within an element

[英]Word XML - XSLT to HTML

[英]XSLT for Word Documents

[英]Word Frequency Counter in XSLT

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 计算xslt中的子集使用XSLT计数 XSLT计算子节点 Xslt中的计数值用变量/未知值XSLT计数 XSLT 计数具有匹配值的元素 XSLT —计数元素中的属性字 XML - XSLT 到 HTML XSLT 用于 Word 文档 XSLT中的字频率计数器

相关标签