0

所以我正在阅读来自不同组织的多个文件。每个文件都有文件编号和组织。我正在尝试通读文件列表,仅从组织中找到那些文件,'OCE'而忽略其他文件。我的目标是计算总共有多少个文件'OCE',并打印出它们的文件号。

我的问题是如何编码我只想从中选择文件'OCE'并忽略其他文件的部分?甚至不确定要使用哪些语句。任何建议都非常感谢。

for filepath in matches[:20]:
    with open (filepath,'rt') as mytext:
        mytext=mytext.read()


        # Find all files from 'OCE'.
        grabOrg=re.findall(r'NSF\s+Org\s+\:\s+(OCE)',mytext)
        if len(grabOrg) != 0:
            OCEOrg=grabOrg[0]   **# Here is my question.**

            from collections import Counter
            countOrg=Counter(OCEOrg)
            print str(OCEOrg) + '|' + countOrg
4

0 回答 0