簡體   English   中英

從 EDGAR XBRL 文件構建財務表

[英]Build financial table from EDGAR XBRL files

當公司向 SEC 提交報告時,會提供一些文件。 例如最新的 10-K 的AAPL 由此,甚至 SEC 網站(以及許多其他網站)也將表格制作為結構化數據

我想做的是自己復制它,但被卡住了。 有人可以向我指出詳細的分步說明如何做到這一點嗎?

通常 SO 用戶會詢問更具體的問題和 OP 嘗試過的事情列表,所以,這就是我嘗試過的,我理解的:

  • 底部的六個文件(示例中的 8-12、15)已使用所有數據。 基本上,公司提交的 8-12 和 15 是文件本身的內聯 Xbrl 的摘錄(示例中的 1)。
  • 提取文件 (15) 列出了所有 Xbrl 實例和所有上下文。 非常清楚。
  • XSD 文件 (8) 包含所有 forms 和所有公司特定元素的列表。 第一個在 link:roleType 塊中給出,給出一個定義和它出現的鏈接庫列表(盡管有時它們不出現)。 第二個以 <xs:element>-s 的形式給出。
  • 演示文件 (12) 具有相同的表格列表。
  • 定義 (10) 和 label (11) 鏈接庫應提供更多詳細信息,例如某個數據的公司特定 label。
  • 計算鏈接庫並不是真正需要的(我猜),它更多的是驗證總數確實是如何計算的。

我不明白的是:

  • 從這些文件構建表的正確方法是什么? 是通過 XSD/PRE forms 並在提取文件中找到它們的數據還是相反?
  • 無論我多么努力,我都找不到提取文件中的數據點和 LAB 文件中的 label 之間的鏈接(包含所有定位器和弧)。 作為人類,它“容易”,但作為機器,名稱總是略有不同(例如(a)loc_XYZ 更改為lab_XYZ;(b)名稱“XYZ”有自己的版本和“XYZAbstract”版本, (c) 像 XYZ 這樣的名稱附有數字 XY_123),因此我無法建立“兩端”之間的聯系。

這就是為什么我想要一步一步的解釋,比如:

  • 拿文件……先。 那里遍歷 <...> 標簽。 對於每個標簽,在文件...中找到一個 <...> 標簽,其中屬性... 等於迭代標簽的... 屬性。 等等。

謝謝,

PS(我對已經這樣做的可用軟件和服務不感興趣,也不對某些特定的庫調用。我只是想使用純文本文件提取信息。)

如果您希望在不重復使用現有 XBRL 軟件的情況下處理 XBRL,那么最好的起點是XBRL 規范 特別是, XBRL 中的 XLink部分將解釋 XBRL Linkbases 的工作原理,包括xlink:fromxlink:to屬性中使用的標簽。 簡短的回答是,這些屬性只包含任意標識符,這些標識符引用文件中其他位置元素的xlink:label屬性。

如何從 XBRL 數據構建財務表的具體問題非常棘手。 XBRL 報告不包含將報告中的事實與表格相關聯的任何明確信息。 您可以從演示鏈接庫的財務報告部分中構建概念列表,但您經常會發現使用這些概念獲得的事實比預期的要多。 例如,如果您從“資產負債表”部分構建概念列表,您通常會發現您擁有使用這些概念但具有附加維度的事實,因為它們是從提供該概念細分的注釋中標記的。

SEC 使用基於啟發式的方法將事實組織成表格。 此過程記錄在Edgar Filer Manual的第 6.24 節中。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM