簡體   English   中英

如何過濾Twitter流API提要以僅獲取新聞相關項目?

[英]How to filter twitter streaming API feed to get only news related items?

我正在構建一個應用程序,當前使用Twitter流API查找與足球俱樂部相關的新聞。 但是我只想要那些與足球俱樂部新聞有關的推文。 截至目前,我收到的每條推文都帶有足球俱樂部的名稱。 有時這些結果無關緊要

您需要教您的應用“足球俱樂部新聞”和“無關”之間的區別。 這是一個以“機器學習”為總主題的研究領域。 除非內容提供者給您提供可以滿足您特定要求的消息標簽,否則恐怕您將無法建立和完善經過訓練的模型來對找到的文章進行分類。

有兩種基本方法:

  1. 分析自己的決策過程:出所有你與你的初始過濾看到的消息, 如何確定哪些是相關的? 涉及哪些因素? 編寫代碼以體現這一點。
  2. 將大量郵件樣本分類為“好”或“壞”。 將這些分類輸入適合您任務的深度學習引擎(文本處理,也許是卷積神經網絡)。 保存經過訓練的模型,並將其稱為應用程序的一部分。

當然,這樣做有一種舊方法:請一排有薪工作人員閱讀並分類過濾器顯示的文章。 將這些消息發布到應用程序的輸入緩沖區。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM