簡體 English 中英

從 EDGAR XBRL 文件構建財務表

[英]Build financial table from EDGAR XBRL files

原文 2022-01-19 14:26:17 0 1 xbrl/ edgar

當公司向 SEC 提交報告時，會提供一些文件。 例如最新的 10-K 的AAPL 。 由此，甚至 SEC 網站（以及許多其他網站）也將表格制作為結構化數據。

我想做的是自己復制它，但被卡住了。 有人可以向我指出詳細的分步說明如何做到這一點嗎？

通常 SO 用戶會詢問更具體的問題和 OP 嘗試過的事情列表，所以，這就是我嘗試過的，我理解的：

底部的六個文件（示例中的 8-12、15）已使用所有數據。 基本上，公司提交的 8-12 和 15 是文件本身的內聯 Xbrl 的摘錄（示例中的 1）。
提取文件 (15) 列出了所有 Xbrl 實例和所有上下文。 非常清楚。
XSD 文件 (8) 包含所有 forms 和所有公司特定元素的列表。 第一個在 link:roleType 塊中給出，給出一個定義和它出現的鏈接庫列表（盡管有時它們不出現）。 第二個以 <xs:element>-s 的形式給出。
演示文件 (12) 具有相同的表格列表。
定義 (10) 和 label (11) 鏈接庫應提供更多詳細信息，例如某個數據的公司特定 label。
計算鏈接庫並不是真正需要的（我猜），它更多的是驗證總數確實是如何計算的。

我不明白的是：

從這些文件構建表的正確方法是什么？ 是通過 XSD/PRE forms 並在提取文件中找到它們的數據還是相反？
無論我多么努力，我都找不到提取文件中的數據點和 LAB 文件中的 label 之間的鏈接（包含所有定位器和弧）。 作為人類，它“容易”，但作為機器，名稱總是略有不同（例如（a）loc_XYZ 更改為lab_XYZ；（b）名稱“XYZ”有自己的版本和“XYZAbstract”版本， (c) 像 XYZ 這樣的名稱附有數字 XY_123)，因此我無法建立“兩端”之間的聯系。

這就是為什么我想要一步一步的解釋，比如：

拿文件……先。 那里遍歷 <...> 標簽。 對於每個標簽，在文件...中找到一個 <...> 標簽，其中屬性... 等於迭代標簽的... 屬性。 等等。

謝謝，

PS（我對已經這樣做的可用軟件和服務不感興趣，也不對某些特定的庫調用。我只是想使用純文本文件提取信息。）

1 個解決方案

如果您希望在不重復使用現有 XBRL 軟件的情況下處理 XBRL，那么最好的起點是XBRL 規范。 特別是， XBRL 中的 XLink部分將解釋 XBRL Linkbases 的工作原理，包括xlink:from和xlink:to屬性中使用的標簽。 簡短的回答是，這些屬性只包含任意標識符，這些標識符引用文件中其他位置元素的xlink:label屬性。

如何從 XBRL 數據構建財務表的具體問題非常棘手。 XBRL 報告不包含將報告中的事實與表格相關聯的任何明確信息。 您可以從演示鏈接庫的財務報告部分中構建概念列表，但您經常會發現使用這些概念獲得的事實比預期的要多。 例如，如果您從“資產負債表”部分構建概念列表，您通常會發現您擁有使用這些概念但具有附加維度的事實，因為它們是從提供該概念細分的注釋中標記的。

SEC 使用基於啟發式的方法將事實組織成表格。 此過程記錄在Edgar Filer Manual的第 6.24 節中。