使用NLTK的Heroku Django應用程序：如何在應用程序中使用NLTK語料庫？

Question

我正在為Django應用程序使用python NLTK。 在本地，我下載了NLTK語料庫，一切正常。 對於heroku，我嘗試將corpora放到文件系統上並推送到heroku（如下所述： LookupError：未找到資源'corpora / stopwords' ），但這超出了heroku的1GB限制。

現在，我已將語料庫添加到AWS S3存儲桶中，但無法弄清楚如何將nltk數據導入django應用程序。 我該怎么做？ 謝謝！

Answer 1

做到這一點的方法是將S3存儲桶公開，然后使用相應的url獲取所需的對象。

例如：

pos_tagger = nltk.data.load("http://<your S3 bucket with the nltk data>.s3.amazonaws.com/nltk_data/taggers/maxent_treebank_pos_tagger/english.pickle")

使用NLTK的Heroku Django應用程序：如何在應用程序中使用NLTK語料庫？

問題描述

1 個解決方案

解決方案1
1 已采納 2015-09-30 17:34:56

使用NLTK的Heroku Django應用程序：如何在應用程序中使用NLTK語料庫？

問題描述

1 個解決方案

解決方案1 1 已采納 2015-09-30 17:34:56

解決方案1
1 已采納 2015-09-30 17:34:56