[英]Heroku Django app using NLTK: How do I use the NLTK corpora in the app?
我正在為Django應用程序使用python NLTK。 在本地,我下載了NLTK語料庫,一切正常。 對於heroku,我嘗試將corpora放到文件系統上並推送到heroku(如下所述: LookupError:未找到資源'corpora / stopwords' ),但這超出了heroku的1GB限制。
現在,我已將語料庫添加到AWS S3存儲桶中,但無法弄清楚如何將nltk數據導入django應用程序。 我該怎么做? 謝謝!
做到這一點的方法是將S3存儲桶公開,然后使用相應的url獲取所需的對象。
例如:
pos_tagger = nltk.data.load("http://<your S3 bucket with the nltk data>.s3.amazonaws.com/nltk_data/taggers/maxent_treebank_pos_tagger/english.pickle")
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.