-2

我需要从已经格式化的字符串生成字符串正则表达式(或至少是格式字符串)。这是怎么做到的?

我的用例:我收到了一个名为“ Collected stuff (part 3).doc ”的文档标题,需要找到所有相关文档(例如 part1、part2 和 part 3)。复杂之处在于该文档可能被称为非常古老的收集的东西 [part 2].txt甚至是Misc stuff, vol 4 .doc**

是否有捷径可寻?在 python 中的奖金。

谢谢。肯特

4

1 回答 1

0

从逻辑上讲,您将如何将原始字符串与要匹配的内容联系起来?原始字符串的哪一部分存在于其他字符串中,它们有什么共同点?想出一个足够复杂的程序来覆盖你的所有基础,而且这是可靠的,这将是相当困难的。

我认为您最好的选择是提出首选匹配的层次结构。

例如,如果您从"Collected stuff (part 3).doc"开始,您可能想先尝试匹配包含括号内所有内容的内容,然后再开始尝试根据卷号匹配内容。

非常旧的收集的东西 [part 2.txt不是比Misc 的东西更好的匹配,vol 4.doc吗?

于 2013-01-29T17:32:14.833 回答