有点沮丧,我无法解决这个问题,但我想定义一个选择未知数量的单词的正则表达式(一些间隔,一些合并数字,一些下划线)。
当我说“未知数量的单词”时,我很乐意将其限制为 10 个,如果这更现实的话。基本上我正在扫描文件名并且不怀疑有任何超过 10 个单词,但最好不必设置限制。
到目前为止我最好的是:
tc = re.findall(r'FROM CLIP NAME:\s\s(\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*)', text)
其中 'FROM CLIP NAME:\s\s' 将位于每行的开头。
我上面的尝试完全失败,因为 \s 读取换行符和空格,因此也从下一行获取数据。