[英]Tokenizing dutch words
阅读这篇文章,我发现我可以使用荷兰语句子标记器,如下所示:
nltk.download('punkt')
tokenizer = nltk.data.load('tokenizers/punkt/dutch.pickle')
tokernizer.tokenize('Ik liep naar huis. Dat deed ik gisteren')
但是有没有办法使用荷兰语单词标记器? 英文版(默认的“punkt”)似乎可以工作,但我猜它在某些时候可能会出错 go
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.