簡體   English   中英

使用NLTK的Heroku Django應用程序:如何在應用程序中使用NLTK語料庫?

[英]Heroku Django app using NLTK: How do I use the NLTK corpora in the app?

我正在為Django應用程序使用python NLTK。 在本地,我下載了NLTK語料庫,一切正常。 對於heroku,我嘗試將corpora放到文件系統上並推送到heroku(如下所述: LookupError:未找到資源'corpora / stopwords' ),但這超出了heroku的1GB限制。

現在,我已將語料庫添加到AWS S3存儲桶中,但無法弄清楚如何將nltk數據導入django應用程序。 我該怎么做? 謝謝!

做到這一點的方法是將S3存儲桶公開,然后使用相應的url獲取所需的對象。

例如:

pos_tagger = nltk.data.load("http://<your S3 bucket with the nltk data>.s3.amazonaws.com/nltk_data/taggers/maxent_treebank_pos_tagger/english.pickle")

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM