problem arises when using mosestokenizer ( https://github.com/luismsgomes/mosestokenizer , installed through pypi https://pypi.org/project/mosestoken ...
problem arises when using mosestokenizer ( https://github.com/luismsgomes/mosestokenizer , installed through pypi https://pypi.org/project/mosestoken ...
我正在尝试在 python 中使用统计机器翻译,到目前为止,我一直主要使用翻译库。 但是,我听说 Moses, Phraser 在机器翻译方面做得更好,所以我想知道在 python 中是否有使用它们的方法。 可能吗? 任何解释将不胜感激。 ...
上下文,我正在尝试从https://github.com/moses-smt/mosesdecoder/blob/master/scripts/tokenizer/normalize-punctuation.perl#L87将Perl代码移植到Python中,这里有此正则表达式Perl: ...
我遇到一个异常,将moses(统计机器翻译)作为安装了xmlrpc的服务调用。 我首先打开一个连接到Moses服务器的端口 但是主要的问题是当我发送带有xml作为主体参数的rest请求时。 当我在http://xxx.xxx.xxx.xxx:8082/RPC2上将其作为POST ...
我一直在官方网站(和pdf手册)中的giza ++短语表输出中搜索数字的含义: http : //www.statmt.org/moses/?n= FactoredTraining.ScorePhrases 这就是我要提出的。 假设这是词组表中的一行 这意味着: 这些 ...
我刚刚安装了 moses 2.1 ,在尝试示例模型时出现错误:无法读取 /phrase-model/moses.ini 我发送的命令是 echo 'das ist ein kleines haus' | /Users/kagrawal/Desktop/tools/moses/bin/moses ...
Moses Tokenizer是广泛用于机器翻译和自然语言处理实验的标记器。 有一行正则表达式检查: 如果我错了,请纠正我,第二和第三个条件是检查 前缀是否在不间断前缀列表中 该单词是否不是最后一个标记,是否还有一个小写的标记作为下一个单词。 问题在于它检查的第一个条件: ...
我试图制作一个基线 MT 系统。 只是为了检查它是如何工作的,我制作了只有 2000 个句子的源 (S) 和目标 (T) 语言语料库。 第一步是为机器翻译 (MT) 系统准备数据。 在这一步中,首先我们必须执行此处提到的标记化Baseline SMT 。 我用过这个代码: (比如 S = 法语 ...
我是一个初学者程序员,所以我仍在尝试掌握一些东西。 请保持温柔。 我正在尝试在OS X上安装和编译Moses( http://www.statmt.org/moses/?n=Development.GetStarted ),但遇到了很多问题。 我一直遵循本网站( http://ww ...
我下载了mosesdecoder并成功编译了它。 由于存在一些版本不同的boost错误,因此我在自定义目录中安装了boost。 我正在尝试使用自定义增强安装来安装mgiza。 在moses其他资源页面中: http : //www.statmt.org/moses/?n= Moses. ...
有没有人知道如何用从这里获得的Anymalign替换Moses中的GIZA ++ 事实上,使用摩西有9个步骤 ,我想在不通过第2步和第3步的情况下开始第4步,但似乎不可能不使用GIZA ++。 有人有线索吗? ...
从Moses Machine Translation Toolkit中获得这样的配置文件: 我需要从[weights]部分读取参数: 我一直在这样做: 获得此输出: 然后使用解析输出 要得到: 当前的解决方案包括从配置文件中读取一些疯狂的反转行,然 ...
我已经开始和摩西一起玩,并试图制作我认为相当标准的基线系统。 我基本上遵循了网站上描述的步骤 ,但我没有使用news-commentary ,而是使用Europarl v7进行培训,使用WMT 2006开发套件和原始的Europarl常用测试。 我的想法是做一些类似于Le Nagard&Ko ...
Moses是一个建立机器翻译模型的软件。 而KenLM是摩西使用的KenLM语言模型软件。 我有一个16GB文本的文本文件,我用它来构建一个语言模型: 生成的文件( text.arpa )为38GB。 然后我将语言模型二进制化: 二进制语言模型( text.binary ...
目前,我刚接触摩西,并且已经训练了一些网站上提供的示例数据集。 我正在寻找更多的数据集来训练系统。 这些在线可用吗? 在Google上搜索时我应该看什么? ...
我已经在/ opt / moses中安装了libxmlrpc-core-c3-dev软件包(使用aptitude)和irstlm 之后,我跑步 看起来一切都安装成功,异常为Mosesserver二进制文件。 grepping install.txt之后,我发现了这一点: ...
我需要使用MOSES创建北印度语到英语的翻译系统。 我有一个平行的语料库,包含大约10000个印地语句子和相应的英语翻译。 我遵循了“ 基线系统创建”页面中描述的方法。 但是,就在第一阶段,当我想标记我的印地语语料并尝试执行时 ,令牌生成器给了我以下输出: 我什至尝试使用' ...
我正在使用Xcode 6.1在我的Mac OS X 10.9.5上安装摩西翻译软件。 说明说我需要安装g++和Boost 。 一旦我这样做,我git clone,“cd”进入目录,然后键入./bjam -j8 。 首先,我确认我有先决条件。 首先,g ++(我只是点击TAB查看可用的内容 ...
我正在尝试编译摩西(机器翻译工具)。 我编译时指定了boost的位置如下。 但是我遇到了很多这样的错误。 出了什么问题? ...
我正在尝试使用os linux ubuntu 12.04,gcc版本4.6.3和计算机类型为i686在计算机上安装SRILM。 在该过程的最后,它给出了两个错误的结果,如下所示: -o ../obj/i686/tclmain.o tclmain.cc tclmain.cc:8:17:致命 ...