簡體   English   中英

查找文本中字符串的特定模式

[英]Find specific patteren of string in text

我正在尋找一種方法來查找文本中的某些特定模式。 例如,如果我想從像這樣的文本中找到所有引用:

  • 納奧米·巴倫(Baron,Naomi)(2000年)致電子郵件的字母:英語的發展歷程和前進方向,勞特利奇:倫敦和紐約。

因此,與此類似的任何內容都將從輸入文本中返回。 有沒有與此相配的算法。 到目前為止,我發現的只是用於搜索文本中相似字符串的算法。

我當時正在考慮使用正則表達式,但是我不知道這是否是最好的方法,因為我需要可以計算相似度指數並返回得分最高的匹配項。

您正在尋找的技術稱為信息提取。

這是我對類似問題的回答:

蘋果如何找到電子郵件中的日期,時間和地址?

您可能還需要結合一些命名實體識別。 http://en.wikipedia.org/wiki/Named-entity_recognition

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM