繁体   English   中英

使用NLTK和Python从自由文本中提取关键字/短语以进行结构化查询

[英]Keyword/phrase extraction from free text using NLTK and Python for structured queries

我想从免费文本中解译特定的关键字,例如“我想从最近的餐馆订购煮鸡蛋和菠菜汤,并使用它们来搜索数据库中的内容。例如,我想提取以下特定的关键字并想要输出类似于(关键字类型,关键字值)的元组,例如('Food Item','Boiled Eggs'),('Food Item','Spinach Soup'),('Location','Nearest Restaurants ')等

需要使用这些值和类型来进一步优化和查询数据库中的表。

我一直在努力尝试使用python和NLTK的各种技术来找到答案,但需要帮助将我指向正确的方向。 我是否使用正确的技术/框架? 在这里需要帮助

谢谢,萨米

这并不困难,但也不是那么精确。

使用NLTK的PoS标记 ,然后提取nounscompound nouns ,并在您的数据库查询中使用它们。

自然句子实际上包含两个部分,一个动作(即动词)和一个名词(即宾语)。

因此,“我想从最近的餐馆订购煮鸡蛋和菠菜汤”告诉我们:

  • 动作/动词是order
  • 物品/名词是boiled eggsspinach soup
  • 位置是nearest restaurants

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM