cost 245 ms
使用 NLTK Python 的詞的總頻率計數

[英]Total Frequency Count for words using NLTK Python

在測試編寫代碼的標准方法來計算句子中單詞的總頻率(計算相同單詞出現的次數)時,使用帶有 Python 的 NLTK,我沒有得到任何結果,程序沒有 output 一個結果。 似乎循環可能沒有運行或其他什么。 書面代碼是 NLTK 組織提供的一種方法,用於查找文檔或字符串的詞頻總數。 下面是代碼, ...

使用 NLTK 構建字符級 Ngram 語言模型

[英]Building a Character-Level Ngram Language Model with NLTK

我正在嘗試使用 NLTK 的 KneserNeyInterpolated 函數在字符級別構建語言模型。 我擁有的是熊貓數據框中單詞的頻率列表,唯一的列是它的頻率(單詞本身就是索引)。 我已經根據單詞的平均長度確定 9-gram 模型是合適的。 嘗試調試: 這有效(我猜?),但我似乎無法將功能 ...

獲取日語文本的 METEOR 分數

[英]Obtaining METEOR scores for Japanese text

我希望為幾個日本琴弦生成 METEOR 樂譜。 我已經導入了nltk 、 wordnet和omw但結果並沒有讓我相信它可以正常工作。 from nltk.corpus import wordnet from nltk.translate.meteor_score import single_mete ...

如何在標簽后獲得統一的詞?

[英]How to get consolidated words post tagging?

我正在處理一個數據集,該數據集需要從數據框列的每個句子中提取所有形容詞、動詞和副詞。 這是我正在研究的一個示例,以確定如何獲得所需的輸出。 它給我的輸出是: 我需要得到的輸出是這樣的: 有人可以幫忙嗎? ...

在 function 中使用 nltk.book 導入

[英]Using nltk.book import in a function

我正在嘗試編寫一個簡單的 function 如下: 我知道我可以在 function 之前導入文本。 但是,我想知道為什么會出現以下錯誤 ImportError:無法從“nltk.book”導入名稱“文本” 它告訴我,作為語料庫的“文本”在 nltk 中不存在——這是真的。 但是,我希望用戶將文本識 ...

如何閱讀以下代碼行?

[英]How do I read the following lines of code?

為這個基本問題道歉,因為我對這個話題很陌生。 您能否按照下面給出的格式破解上面的代碼: ...

如何在 python 中使用 nltk 找到特定的二元語法?

[英]How can I find a specific bigram using nltk in python?

我目前正在使用 nltk.book iny Python 並想找到特定二元組的頻率。 我知道有 bigram() function 可以為您提供文本中最常見的二元語法,如以下代碼所示: 但是如果我只搜索一個特定的詞,比如“wish for”呢? 到目前為止,我在 nltk 文檔中找不到任何相關信息 ...

在此示例中如何使用 nltk.metrics 中的 edit_distance()?

[英]How to use edit_distance() from nltk.metrics in this example?

在以下示例中使用edit_distance()我有一點問題。 我需要在 5 列中打印語言列表中提到的語言中的單詞,這不是問題。 我已經這樣做了: 這部分按預期工作。 現在我需要測量來自“be”語言的單詞與其他語言中該單詞的等價詞之間的 Levensthein 字符串編輯距離。 並且距離應該出現在括 ...

WordNet 語料庫中的單詞澄清

[英]Words in WordNet corpus clarification

我想獲取WordNet語料庫中的單詞長度 代碼: 我得到的輸出為147306 我的問題: 我是否在WordNet獲得了單詞的總長度? 諸如zoom_in tokens算作word嗎? ...

波特和蘭開斯特的詞干澄清

[英]Porter and Lancaster stemming clarification

我正在使用Porter和Lancaster進行stemming ,我發現這些觀察結果: 我的問題是: Lancaster應該是“積極的” stemmer但它與replied正常工作。 為什么? 單詞In在Porter保持不變,但大寫In ,為什么? 請注意, Lancaster正 ...

Python - 使用遞歸 function 按字母排序順序打印出 trie

[英]Python - printing out a trie in alphabetically sorted order with a recursive function

我正在閱讀 Bird、Klein 和 Loper 的NLTK 書籍,但遇到了一個問題。 我正在閱讀這本書以充實自己,而不是為了 class。 我遇到的問題是 4.29: 編寫一個遞歸 function 以按字母順序漂亮地打印一個 trie,例如: chair: 'flesh' ---t: 'cat ...

為nltk設置macecommand的路徑

[英]Setting path for macecommand for nltk

我從用於設置證明者9路徑的鏈接config_prover9方法中找到了一種設置證明者9的路徑的解決方案是否也有類似的方法來處理macecommand? 我的代碼如下 有沒有辦法設置它來找到我安裝Macecommand的目錄? 提前致謝。 ...

nltkdispersion_plot()函數不起作用。 線型“ |”是否已從matplotlib中刪除?

[英]nltk dispersion_plot() function not working. Has the line-style “|” been removed from matplotlib?

我正在嘗試使用nltkdispersion_plot()函數繪制詞匯分散圖。 我的代碼是 我得到的結果是 ] 1 ) 在進行了一些Google搜索並瀏覽了dispersion_plot()函數的代碼( https://www.nltk.org/_modules/nltk/d ...

語料庫的詞匯表中沒有單詞,單詞僅在gensim庫中顯示在單個列表中

[英]'word' not in Vocabulary in a corpus with words shown in a single list only in gensim library

您好社區成員, 目前,我正在實現Word2Vec算法。 首先,我提取了數據(句子),將句子分解並拆分為標記(單詞),刪除了標點符號並將標記存儲在單個列表中。 該列表基本上包含單詞。 然后,我計算了單詞的頻率,然后根據頻率來計算單詞的出現次數。 結果列表。 接下來,我嘗試使 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM