我对python相当陌生,所以如果这是一个新手问题,我很抱歉,但我正在尝试从原始文本文件中具有特定格式的括号中提取文本。我已经用正则表达式尝试过这个,但是如果他们是更好的方法,请告诉我。
举例说明我想做什么:
s = "Testing (Stackoverflow, 2013). Testing (again) (Stackoverflow, 1999)"
从这个字符串我想要一个类似的结果:
['(Stackoverflow, 2013)', '(Stackoverflow, 1999)']
到目前为止我尝试过的正则表达式是
"(\(.+[,] [0-9]{4}\))"
与 re.findall() 一起使用,但这只会给我结果:
['(Stackoverflow, 2013). Testing (again) (Stackoverflow, 1999)']
因此,正如您可能已经猜到的那样,我正在尝试从 .txt 文件中提取参考书目。但我不想提取任何恰好在括号中但不是书目参考的内容。
再次,如果这是新手,我再次道歉,如果已经存在这样的问题,我再次道歉。我已经搜索过,但还没有运气。