標簽[nltk-book] - 堆棧內存溢出

[英]NLTK available languages for word tokenization and sentence tokenization

我需要了解 NLTK 中的標記化對於哪些語言是可能的。我想我需要像這樣設置語言：我需要了解我可以使用哪些語言，但我找不到有關 nltk 文檔的任何信息。 ...

[英]Total Frequency Count for words using NLTK Python

在測試編寫代碼的標准方法來計算句子中單詞的總頻率（計算相同單詞出現的次數）時，使用帶有 Python 的 NLTK，我沒有得到任何結果，程序沒有 output 一個結果。似乎循環可能沒有運行或其他什么。書面代碼是 NLTK 組織提供的一種方法，用於查找文檔或字符串的詞頻總數。下面是代碼， ...

如何將其寫入 Python 3 中的 function 中？

[英]How do I write this into a function in Python 3?

我將如何將其寫入給出相同 output 的 function 中？ ...

使用 NLTK 構建字符級 Ngram 語言模型

[英]Building a Character-Level Ngram Language Model with NLTK

我正在嘗試使用 NLTK 的 KneserNeyInterpolated 函數在字符級別構建語言模型。我擁有的是熊貓數據框中單詞的頻率列表，唯一的列是它的頻率（單詞本身就是索引）。我已經根據單詞的平均長度確定 9-gram 模型是合適的。嘗試調試：這有效（我猜？），但我似乎無法將功能 ...

獲取日語文本的 METEOR 分數

[英]Obtaining METEOR scores for Japanese text

我希望為幾個日本琴弦生成 METEOR 樂譜。我已經導入了nltk 、 wordnet和omw但結果並沒有讓我相信它可以正常工作。 from nltk.corpus import wordnet from nltk.translate.meteor_score import single_mete ...

如何在標簽后獲得統一的詞？

[英]How to get consolidated words post tagging?

我正在處理一個數據集，該數據集需要從數據框列的每個句子中提取所有形容詞、動詞和副詞。這是我正在研究的一個示例，以確定如何獲得所需的輸出。它給我的輸出是：我需要得到的輸出是這樣的：有人可以幫忙嗎？ ...

在 function 中使用 nltk.book 導入

[英]Using nltk.book import in a function

我正在嘗試編寫一個簡單的 function 如下：我知道我可以在 function 之前導入文本。但是，我想知道為什么會出現以下錯誤 ImportError：無法從“nltk.book”導入名稱“文本” 它告訴我，作為語料庫的“文本”在 nltk 中不存在——這是真的。但是，我希望用戶將文本識 ...

如何閱讀以下代碼行？

[英]How do I read the following lines of code?

為這個基本問題道歉，因為我對這個話題很陌生。您能否按照下面給出的格式破解上面的代碼： ...

如何在 python 中使用 nltk 找到特定的二元語法？

[英]How can I find a specific bigram using nltk in python?

我目前正在使用 nltk.book iny Python 並想找到特定二元組的頻率。我知道有 bigram() function 可以為您提供文本中最常見的二元語法，如以下代碼所示：但是如果我只搜索一個特定的詞，比如“wish for”呢？到目前為止，我在 nltk 文檔中找不到任何相關信息 ...

如何將 nltk.book 的 output、common_contexts function 轉換為變量

[英]How to take output of nltk.book, common_contexts function to a variable

nltk.book 中的 common_contexts 返回 NoneType ，因此如何將其 output 存儲到變量中上面的 wtc 變量將返回 NONE。 ...

在此示例中如何使用 nltk.metrics 中的 edit_distance()？

[英]How to use edit_distance() from nltk.metrics in this example?

在以下示例中使用edit_distance()我有一點問題。我需要在 5 列中打印語言列表中提到的語言中的單詞，這不是問題。我已經這樣做了：這部分按預期工作。現在我需要測量來自“be”語言的單詞與其他語言中該單詞的等價詞之間的 Levensthein 字符串編輯距離。並且距離應該出現在括 ...

WordNet 語料庫中的單詞澄清

[英]Words in WordNet corpus clarification

我想獲取WordNet語料庫中的單詞長度代碼：我得到的輸出為147306 我的問題：我是否在WordNet獲得了單詞的總長度？諸如zoom_in tokens算作word嗎？ ...

波特和蘭開斯特的詞干澄清

[英]Porter and Lancaster stemming clarification

我正在使用Porter和Lancaster進行stemming ，我發現這些觀察結果：我的問題是： Lancaster應該是“積極的” stemmer但它與replied正常工作。為什么？單詞In在Porter保持不變，但大寫In ，為什么？請注意， Lancaster正 ...

如何計算python庫nltk中古騰堡語料庫中的單詞覆蓋率？

[英]how to calculate Word Coverage in gutenburg corpus in python library nltk?

計算與文本語料庫 gutenberg 關聯的所有文件 ID 的單詞覆蓋率。這個的寫代碼是什么， ...

Python - 使用遞歸 function 按字母排序順序打印出 trie

[英]Python - printing out a trie in alphabetically sorted order with a recursive function

我正在閱讀 Bird、Klein 和 Loper 的NLTK 書籍，但遇到了一個問題。我正在閱讀這本書以充實自己，而不是為了 class。我遇到的問題是 4.29：編寫一個遞歸 function 以按字母順序漂亮地打印一個 trie，例如： chair: 'flesh' ---t: 'cat ...

為nltk設置macecommand的路徑

[英]Setting path for macecommand for nltk

我從用於設置證明者9路徑的鏈接config_prover9方法中找到了一種設置證明者9的路徑的解決方案是否也有類似的方法來處理macecommand？我的代碼如下有沒有辦法設置它來找到我安裝Macecommand的目錄？提前致謝。 ...

構建基於功能的語法時，為什么會出現“無效語法”錯誤？

[英]When building Feature based grammar, why do I get “invalid syntax” error?

為什么在％開頭S的行中出現“無效語法”？ ...

Python：AttributeError：'NoneType'對象沒有屬性'start'

[英]Python : AttributeError: 'NoneType' object has no attribute 'start'

以下代碼屬於NLTK正則表達式：我得到的錯誤是：我已經包含了它的庫，但是仍然顯示錯誤。我如何處理此錯誤？ ...

nltkdispersion_plot（）函數不起作用。線型“ |”是否已從matplotlib中刪除？

[英]nltk dispersion_plot() function not working. Has the line-style “|” been removed from matplotlib?

我正在嘗試使用nltkdispersion_plot（）函數繪制詞匯分散圖。我的代碼是我得到的結果是 ] 1 ）在進行了一些Google搜索並瀏覽了dispersion_plot（）函數的代碼（ https://www.nltk.org/_modules/nltk/d ...

語料庫的詞匯表中沒有單詞，單詞僅在gensim庫中顯示在單個列表中

[英]'word' not in Vocabulary in a corpus with words shown in a single list only in gensim library

您好社區成員，目前，我正在實現Word2Vec算法。首先，我提取了數據（句子），將句子分解並拆分為標記（單詞），刪除了標點符號並將標記存儲在單個列表中。該列表基本上包含單詞。然后，我計算了單詞的頻率，然后根據頻率來計算單詞的出現次數。結果列表。接下來，我嘗試使 ...