![](/img/trans.png)
[英]NLTK available languages for word tokenization and sentence tokenization
我需要了解 NLTK 中的標記化對於哪些語言是可能的。 我想我需要像這樣設置語言: 我需要了解我可以使用哪些語言,但我找不到有關 nltk 文檔的任何信息。 ...
[英]NLTK available languages for word tokenization and sentence tokenization
我需要了解 NLTK 中的標記化對於哪些語言是可能的。 我想我需要像這樣設置語言: 我需要了解我可以使用哪些語言,但我找不到有關 nltk 文檔的任何信息。 ...
[英]Total Frequency Count for words using NLTK Python
在測試編寫代碼的標准方法來計算句子中單詞的總頻率(計算相同單詞出現的次數)時,使用帶有 Python 的 NLTK,我沒有得到任何結果,程序沒有 output 一個結果。 似乎循環可能沒有運行或其他什么。 書面代碼是 NLTK 組織提供的一種方法,用於查找文檔或字符串的詞頻總數。 下面是代碼, ...
[英]How do I write this into a function in Python 3?
我將如何將其寫入給出相同 output 的 function 中? ...
[英]Building a Character-Level Ngram Language Model with NLTK
我正在嘗試使用 NLTK 的 KneserNeyInterpolated 函數在字符級別構建語言模型。 我擁有的是熊貓數據框中單詞的頻率列表,唯一的列是它的頻率(單詞本身就是索引)。 我已經根據單詞的平均長度確定 9-gram 模型是合適的。 嘗試調試: 這有效(我猜?),但我似乎無法將功能 ...
[英]Obtaining METEOR scores for Japanese text
我希望為幾個日本琴弦生成 METEOR 樂譜。 我已經導入了nltk 、 wordnet和omw但結果並沒有讓我相信它可以正常工作。 from nltk.corpus import wordnet from nltk.translate.meteor_score import single_mete ...
[英]How to get consolidated words post tagging?
我正在處理一個數據集,該數據集需要從數據框列的每個句子中提取所有形容詞、動詞和副詞。 這是我正在研究的一個示例,以確定如何獲得所需的輸出。 它給我的輸出是: 我需要得到的輸出是這樣的: 有人可以幫忙嗎? ...
[英]Using nltk.book import in a function
我正在嘗試編寫一個簡單的 function 如下: 我知道我可以在 function 之前導入文本。 但是,我想知道為什么會出現以下錯誤 ImportError:無法從“nltk.book”導入名稱“文本” 它告訴我,作為語料庫的“文本”在 nltk 中不存在——這是真的。 但是,我希望用戶將文本識 ...
[英]How do I read the following lines of code?
為這個基本問題道歉,因為我對這個話題很陌生。 您能否按照下面給出的格式破解上面的代碼: ...
[英]How can I find a specific bigram using nltk in python?
我目前正在使用 nltk.book iny Python 並想找到特定二元組的頻率。 我知道有 bigram() function 可以為您提供文本中最常見的二元語法,如以下代碼所示: 但是如果我只搜索一個特定的詞,比如“wish for”呢? 到目前為止,我在 nltk 文檔中找不到任何相關信息 ...
[英]How to take output of nltk.book, common_contexts function to a variable
nltk.book 中的 common_contexts 返回 NoneType ,因此如何將其 output 存儲到變量中 上面的 wtc 變量將返回 NONE。 ...
[英]How to use edit_distance() from nltk.metrics in this example?
在以下示例中使用edit_distance()我有一點問題。 我需要在 5 列中打印語言列表中提到的語言中的單詞,這不是問題。 我已經這樣做了: 這部分按預期工作。 現在我需要測量來自“be”語言的單詞與其他語言中該單詞的等價詞之間的 Levensthein 字符串編輯距離。 並且距離應該出現在括 ...
[英]Words in WordNet corpus clarification
我想獲取WordNet語料庫中的單詞長度 代碼: 我得到的輸出為147306 我的問題: 我是否在WordNet獲得了單詞的總長度? 諸如zoom_in tokens算作word嗎? ...
[英]Porter and Lancaster stemming clarification
我正在使用Porter和Lancaster進行stemming ,我發現這些觀察結果: 我的問題是: Lancaster應該是“積極的” stemmer但它與replied正常工作。 為什么? 單詞In在Porter保持不變,但大寫In ,為什么? 請注意, Lancaster正 ...
[英]how to calculate Word Coverage in gutenburg corpus in python library nltk?
計算與文本語料庫 gutenberg 關聯的所有文件 ID 的單詞覆蓋率。 這個的寫代碼是什么, ...
[英]Python - printing out a trie in alphabetically sorted order with a recursive function
我正在閱讀 Bird、Klein 和 Loper 的NLTK 書籍,但遇到了一個問題。 我正在閱讀這本書以充實自己,而不是為了 class。 我遇到的問題是 4.29: 編寫一個遞歸 function 以按字母順序漂亮地打印一個 trie,例如: chair: 'flesh' ---t: 'cat ...
[英]Setting path for macecommand for nltk
我從用於設置證明者9路徑的鏈接config_prover9方法中找到了一種設置證明者9的路徑的解決方案是否也有類似的方法來處理macecommand? 我的代碼如下 有沒有辦法設置它來找到我安裝Macecommand的目錄? 提前致謝。 ...
[英]When building Feature based grammar, why do I get “invalid syntax” error?
為什么在%開頭S的行中出現“無效語法”? ...
[英]Python : AttributeError: 'NoneType' object has no attribute 'start'
以下代碼屬於NLTK正則表達式: 我得到的錯誤是: 我已經包含了它的庫,但是仍然顯示錯誤。 我如何處理此錯誤? ...
[英]nltk dispersion_plot() function not working. Has the line-style “|” been removed from matplotlib?
我正在嘗試使用nltkdispersion_plot()函數繪制詞匯分散圖。 我的代碼是 我得到的結果是 ] 1 ) 在進行了一些Google搜索並瀏覽了dispersion_plot()函數的代碼( https://www.nltk.org/_modules/nltk/d ...
[英]'word' not in Vocabulary in a corpus with words shown in a single list only in gensim library
您好社區成員, 目前,我正在實現Word2Vec算法。 首先,我提取了數據(句子),將句子分解並拆分為標記(單詞),刪除了標點符號並將標記存儲在單個列表中。 該列表基本上包含單詞。 然后,我計算了單詞的頻率,然后根據頻率來計算單詞的出現次數。 結果列表。 接下來,我嘗試使 ...