我使用 Kenlm 在 Google Colab 上训练了一个语言模型。 这是我在 bin 文件夹中的内容: 我在 bin 文件夹中,我也把我的“train.*”文件放在那里但是当 Colab 回复: 我该如何运行它? ...
我使用 Kenlm 在 Google Colab 上训练了一个语言模型。 这是我在 bin 文件夹中的内容: 我在 bin 文件夹中,我也把我的“train.*”文件放在那里但是当 Colab 回复: 我该如何运行它? ...
官网很清楚Windows中不支持kenlm 。 github 存储库中有一个 Windows 标签,但它似乎由少数随机贡献者维护。 那么如何为 Windows 设置 kenlm 呢? ...
我看到很多博客都说语言模型可以用于许多任务,但除了文本生成之外,我找不到任何好的实现。 我的问题是,我如何使用像 kenlm 这样的语言模型来纠正我的句子的对齐和拼写错误。 我知道 kenlm 已经为 deepspeech 执行了此操作,但我想了解它的实际操作方式以及如何实现相同的功能。 ...
我正在尝试从 ubuntu 18.04 为 Android 交叉编译 Kenlm。 为此,我需要先编译它的所有依赖项。 我成功地为 android 编译了 boost,但我不知道如何使用 bzip2。 当我使用 cmake 交叉编译 kenlm 时,使用这个工具链。cmake 我可以看到这个: 我 ...
我正在使用'.arpa'文件提取n-gram概率的Java项目的中期。 理想情况下,我想使用“ .klm”文件(使用“ .arpa”文件创建),类似于: 但是Windows上不支持kenlm for Java。 有谁知道对句子评分的其他方法吗? 谢谢。 ...
当尝试在anaconda环境中从pip安装kenlm的python包装器时 ,我收到错误: pip命令在conda环境之外工作,但是kenlm在环境中不活动。 我也能够从运行linux的AWS ec2实例运行它,所以可能是Mac OSX问题。 知道如何解决这个问题? ...
我在大约5000个英语句子/段落上训练了KENLM语言模型。 我想用两个或多个段来查询该ARPA模型,看看是否可以将它们连接起来以构成一个较长的句子,希望更“语法化”。 以下是我用来获取对数得分(以及基于10的幂值)的段和“句子”的Python代码。 我举了两个例子。 显然,第一个例子中 ...
我有一个python软件包,由于对Windows构建工具的依赖性而无法安装。 我尝试过的事情: 安装最新版本的Visual Studio 2017(AFAIK它应包含Microsoft Visual C ++ 14.0)。 直接从此处https://www.visuals ...
我正在使用以下命令在 Windows 7 64 位的 Python2.7 上安装 KenLM: 错误信息: ...
假设我们在此基础上构建了一个模型: 从困惑公式( https://web.stanford.edu/class/cs124/lec/languagemodeling.pdf ) 应用逆对数公式之和得到内部变量,然后取第n个根,困惑数异常小: 用数据中未找到的句子再试一次: 并再次尝试完 ...
如何用kenlm安装tensorflow? 显然,在使用张量流ctc波束搜索解码器时,没有kenlm的论据。 我们如何将kenlm整合到该函数中? ...