import re
import urllib.request
file_txt = urllib.request.urlopen("ftp://ftp.sec.gov/edgar/data/1408597/0000930413-12-003922.txt")
pattern_item4= re.compile("(Item\\n*\s*4.*)Item\\n*\s*5")
print(re.search(pattern_item4,bytes.decode(f)))
#Returns None
这个正则表达式以 rubular 形式返回我想要的,但显然它没有达到 Python 的预期效果。有人能帮我解决这个问题吗?正则表达式的目的基本上是提取 item4 和 item5 之间的内容。
谢谢