簡體   English   中英

為簡短的文本片段建議語義標記

[英]Suggest semantic tags for short snippets of text

我感興趣的是生成一個建議的語義標簽列表(通過鏈接到Freebase,Wikipedia或其他系統)給發布短文本片段的用戶。 我不是要“理解”文本的真正含義,甚至不是自動標記它,我只是想向用戶建議他/她帖子的最可能的語義標記。 我的主要目標是迫使用戶在語義上進行標記,並因此進行一致標記,而不是使用歧義的文本字符串書寫。 如果市場上有功能合理且價格合理的工具,我會使用它。 我還沒有找到這樣的工具,所以我希望自己編寫。

我的問題是,首先,是否有我沒有遇到過的工具。 我看過Zemanta,AlchemyAPI和OpenCalais,它們似乎都不提供我需要的服務。

假設我正在編寫自己的代碼,那么我將使用Python進行編寫(除非有確實令人信服的理由使用其他代碼)。 我的第一個猜測是在Freebase中搜索與“實體”匹配的n-gram,並將它們建議為標簽,也許還搜索實體的描述以獲取一些“更智能”的信息。 如果那還不夠,我會讀起來,把腳趾浸入本體的水中。 由於這是一個非常棘手的問題,並且我不認為我的應用程序需要它的解決方案,因此我想盡可能避免進行真正的語義分析。

有沒有人有使用語義數據庫系統的經驗,並且可以給我一些有關從哪里開始以及期望什么樣的陷阱的指示?

看看NLTK python庫。 它包含大量的工具,詞典和算法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM