簡體   English   中英

將 IPTC 分類法轉換為 Boolean 表達式

[英]convert IPTC taxonomy to Boolean Expression

可以將 IPTC 分類法更改為 boolean 表達式嗎? 為了簡化新聞交換,國際新聞電信委員會 (IPTC) 開發了 NewsML 架構 (NAR),作為該架構的一部分,特定的受控詞匯表(例如 IPTC 新聞代碼)用於對新聞項目進行分類。 主題代碼是一個包含 1300 個術語的詞庫,用於對每個新聞項目的主要主題(主題)進行分類。”截至 2021 年,有 1400 多個術語。IPTC 主題代碼(從 2012 年開始)是具有 3 層的樹狀結構。我的假設是一組詞匯定義了新聞的類別。我的問題:是否可以將層次結構轉換為 boolean 表達式,如下所示:“武裝沖突”或“武裝爭端”或“內亂”或((“武裝" OR "武器") AND ("right-wing" OR "left-wing" OR "extremist" OR "dangerous" OR "confrontation")) "?

我們 IPTC 過去在構建基於規則的分類引擎作為 Google 新聞倡議項目時曾研究過這個問題。 它被稱為IPTC EXTRA ,它允許用戶根據 boolean 邏輯創建規則,以根據IPTC 媒體主題控制詞匯表(或任何其他 CV)中的術語對文檔進行分類。

規則語言 Extra Query Language (EQL) 比簡單的 Boolean 和/或/非運算符更具表現力。 我們還會查看單詞的接近度和其他一些特征:有關詳細信息,請參閱EXTRA 用戶手冊

您可以在我們的 GitHub 存儲庫中看到為 EXTRA 項目創建的一組測試規則 但請注意,這只是根據 IPTC 媒體主題詞匯對任何內容進行分類所需的規則的一小部分。 目前,我們還不知道對所有媒體主題進行分類的全套規則。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM