在他们的网站上查看了arelle的文档后,我找到了答案。要检索您需要的数据,您可以使用 arelleCmdLine 导出指定相关数据的 csv,其中 --factListCols 后跟所需数据类型的字符串(以空格分隔)。调用 arelleCmdLine 因操作系统而异。
CmdL = 'Applications/Arelle.app/contents/MacOS/arelleCmdLine'
os.system('%s --file %s --factListCols "Name Value Period" --facts %s') % (CmdL,xmlPth,csvPth)
我试图在 xbrl 文档的“事实列表”中获取事实的“属性”。属性保存“名称”数据(或事实的 GAAP 分类法)和保存日期数据“StartDate”、“endDate”和“instant”的“contextRef”。
看来Arelle是我最好的选择;但是,cmdline 实用程序似乎并没有为此查询而削减它,并且 api 文档Here完全空白保存源中的文件名。
是否有人能够解释如何加载 xbrl 文档,加载事实表的事实并将这些事实中的数据和元数据提取到列表中。
下面是一些有助于澄清问题的代码。当我尝试打印我认为包含所有事实和元数据的 modeltuplefacts 时,我得到一个空白列表。这段代码主要是从arelle 包的 arelle 文件夹中的示例中的CustomLogger.py复制和粘贴。我不确定记录器是如何工作的,但它需要它,这个例子似乎满足了它的 Cntlr 要求。
from __future__ import print_function
import sys
sys.path.insert(0, '~/Desktop/Arelle')
from arelle import Cntlr
from arelle import ModelDocument
from arelle import ModelObject as MO
from arelle import ModelInstanceObject as MIO
class CntlrCustomLoggingExample(Cntlr.Cntlr):
def __init__(self):
# no logFileName parameter to prevent default logger from starting
super().__init__()
def run(self):
# start custom logger
CustomLogHandler(self)
path = "~/Desktop/SEC/SECindexes10-k/fileHolder/1/nick-20150630.xml"
modelXbrl = self.modelManager.load(path)
modelDoc = ModelDocument.load(modelXbrl,path)
mf = MIO.ModelFact()
mf.init(modelDoc)
print(mf.modelTupleFacts)
self.modelManager.close()
self.close()
import logging
class CustomLogHandler(logging.Handler):
def __init__(self, cntlr):
logger = logging.getLogger("arelle")
self.level = logging.DEBUG
self.setFormatter(logging.Formatter("[%(messageCode)s] %(message)s - %(file)s %(sourceLine)s"))
logger.addHandler(self)
def emit(self, logRecord):
# just print to standard output (e.g., terminal window)
print(self.format(logRecord))
if __name__ == "__main__":
CntlrCustomLoggingExample().run()