所以我正在阅读来自不同组织的多个文件。每个文件都有文件编号和组织。我正在尝试通读文件列表,仅从组织中找到那些文件,'OCE'
而忽略其他文件。我的目标是计算总共有多少个文件'OCE'
,并打印出它们的文件号。
我的问题是如何编码我只想从中选择文件'OCE'
并忽略其他文件的部分?甚至不确定要使用哪些语句。任何建议都非常感谢。
for filepath in matches[:20]:
with open (filepath,'rt') as mytext:
mytext=mytext.read()
# Find all files from 'OCE'.
grabOrg=re.findall(r'NSF\s+Org\s+\:\s+(OCE)',mytext)
if len(grabOrg) != 0:
OCEOrg=grabOrg[0] **# Here is my question.**
from collections import Counter
countOrg=Counter(OCEOrg)
print str(OCEOrg) + '|' + countOrg